关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11423人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今天很准!公牛全场命中赛季新高19记三分

直播吧 浏览 12517

终究是海外市场救了阳光电源 | 见智研究

华尔街见闻官方 浏览 14579

打工人要休闲就只能辞职回家?董明珠说得过了吗?

新民周刊 浏览 10945

英韧预计 2026 年推出 PCIe 6.0 AI SSD,支持 NVMe + CXL 双协议

IT之家 浏览 1507

不赶潮流的她们,从20岁时髦到80岁

LinkFashion 浏览 12639

德甲球员票选最令人失望主帅:别利察、科瓦奇、图赫尔前三

懂球帝 浏览 10829

不理多国"最后警告" 胡塞武装再在红海引爆炸弹

环球时报国际 浏览 12891

女星参加晚会丢2万元戒指 哭诉自己赔不起被吐槽

娱乐团长 浏览 12937

跟队:拜仁内部不会轻易谈论让伦纳特-卡尔踢世界杯的话题

懂球帝 浏览 943

胡锡进又赚了:炒股不难啊

格隆汇 浏览 15602

Meta CEO 扎克伯格首次参加柔术比赛,夺得金牌和银牌

IT之家 浏览 18432

美媒:美国欲在中东部署更多“海上机器人”

参考消息 浏览 18954

任贤齐与妻子现身美国近况曝光 18岁学霸女儿露面

影像温度 浏览 14492

汤唯最刻骨铭心的那段情,我每年都想重温

Yuki女人故事 浏览 1043

第一批来北京的游客,已经进骨科了

快刀财经 浏览 10838

40余名高二学生被强收7500元网课费 两地教育局调查

大风新闻 浏览 14297

沪指4000点临门一脚,与十年前有何不同?豆包AI这样回答

每经牛眼 浏览 854

"大嫂"为张颂文庆生:祝颂文哥福如东海寿比南山

网易娱乐 浏览 19583

阿齐兹:没首发因刚刚伤愈 球队整体表现还不错

直播吧 浏览 18490

女人年纪大了,不管你差不差钱,都要注重自己的形象打扮自己

静儿时尚达人 浏览 12639

香港五级大火令人揪心 一众明星发声

天启大世界 浏览 388
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1