关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11424人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

淘特回应团队大部分人员合并到淘宝:业务有调整,不会并入淘宝

Tech星球 浏览 18822

“疲惫脸”太丑了!有这些特征的女生怎么救?

Yuki女人故事 浏览 1925

马克龙密会AI专家,法国加入全球人工智能竞赛

环球网资讯 浏览 16187

刘晓庆怒批演员不背台词,被扒出疑似阿娇,季冠霖曾点名吐槽她

萌神木木 浏览 688

朱民解读硅谷银行破产:金融市场逻辑发生根本变化

网易财经智库 浏览 19866

乘客说好送还手机付20元反悔 司机送到18公里外派出所

上游新闻 浏览 75094

新渲染图曝光,消息称iPhone 15 Pro机型泰坦灰将替代金色

IT之家 浏览 14034

王大陆离奇“闪兵”案,搞垮半壁台娱圈

仙女事件簿 浏览 867

从华为手机之路,读懂华为造车

晚点LatePost 浏览 12788

76人新赛季不败金身被破,全胜球队仅剩马刺、雷霆和公牛

懂球帝 浏览 797

还记得“步步高家教机”女孩吗?她暴瘦了15斤?

橘子娱乐 浏览 16736

别太担心美股开年的疲软,这可能只是“宿醉”

巴伦周刊 浏览 12625

唐斯:很高兴湖人接受了拉塞尔 只要你有贡献湖蜜不在乎你的过去

直播吧 浏览 19083

大连有梅花鹿连续2天攻击游客 受伤女子:我没招惹它

极目新闻 浏览 19447

G3掘金15分大胜热火,看赛后马龙、约基奇、布劳恩、穆雷说了啥?

篮球资讯达人 浏览 17012

拉总:诺坎普改叫梅西球场?不合适

体坛周报 浏览 245

英国以"支持俄对乌战争"为由制裁3家中企 中方回应

中国驻英国大使馆 浏览 12663

张本才腐败时间长达十余年 其个人画作曾拍出40万高价

上游新闻 浏览 74942

今年秋冬最时髦的穿法:外套+连帽卫衣,减龄又松弛!

LinkFashion 浏览 777

马斯克星链成缅甸电诈“利器”,美国会已启动调查

界面新闻 浏览 1042

38岁后单赛季为意甲升班马攻入至少4球,瓦尔迪是历史第二人

懂球帝 浏览 287
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1