关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11420人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新版医保目录今启用!这些企业的独家中成药将迎来新生?

上海证券报 浏览 26516

30万分手费vs3000万求婚钻戒:一个前妻的修养

Yuki女人故事 浏览 223

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

IT之家 浏览 704

腾讯首次系统披露研发进展:AI生成50%新增代码,研发自动化水平同比提升67%

华尔街见闻官方 浏览 884

专栏 | 我们对女性友谊太缺乏想象力了

时尚COSMO 浏览 1053

中装建设最新股东户数4.05万,被立案受损投资者可索赔

雷达财经 浏览 12811

英国变异新冠再突变!或将帮助病毒躲避人体免疫系统的攻击

趣看热点 浏览 25692

联合国启动下任秘书长遴选 三大热门人选亮相

红星新闻 浏览 27750

星女郎林允周星驰“分手”?社交零互动不再合作

网易娱乐 浏览 20098

俄媒:苏罗维金已被捕 在叛乱期间站普里戈任一边

财联社 浏览 15905

委内瑞拉武装部队宣布增招士兵5600名

界面新闻 浏览 121

AI 正在接管代码,AWS 首席布道师却说:开发者的未来在「沟通」

极客公园 浏览 912

南加大团队揭秘:让AI做数学题更聪明的"长度感知"训练法

科技行者 浏览 803

泽连斯基:没收到联合国和红十字会国际委员会回应,我很震惊!

环球网资讯 浏览 16547

六大行集体下调!事关存钱

环球网资讯 浏览 16088

姚期智:“AI+量子”将极大拓展人类计算能力边界

文汇报 浏览 1670

双子座流星雨即将引爆冬日夜空,成都“观星+”消费持续升温

红星新闻 浏览 116

女网红直播间卖假货被判3年4个月怎么回事?法律意识真是太淡薄

趣看热点 浏览 25984

东体:地区超重塑观众的心理认同,足协应让草根和职业贯通

懂球帝 浏览 1077

因脑震荡规则,鲁本-迪亚斯无缘曼城欧超杯名单

直播吧 浏览 14320

范志毅《繁花》出场就是一脚 网友:毫无表演痕迹

新民晚报 浏览 12827
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1