关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11424人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

淘特回应团队大部分人员合并到淘宝：业务有调整，不会并入淘宝

Tech星球浏览 18822

“疲惫脸”太丑了！有这些特征的女生怎么救？

Yuki女人故事浏览 1925

马克龙密会AI专家，法国加入全球人工智能竞赛

环球网资讯浏览 16187

刘晓庆怒批演员不背台词，被扒出疑似阿娇，季冠霖曾点名吐槽她

萌神木木浏览 688

朱民解读硅谷银行破产:金融市场逻辑发生根本变化

网易财经智库浏览 19866

乘客说好送还手机付20元反悔司机送到18公里外派出所

上游新闻浏览 75094

新渲染图曝光，消息称iPhone 15 Pro机型泰坦灰将替代金色

IT之家浏览 14034

王大陆离奇“闪兵”案，搞垮半壁台娱圈

仙女事件簿浏览 867

从华为手机之路，读懂华为造车

晚点LatePost 浏览 12788

76人新赛季不败金身被破，全胜球队仅剩马刺、雷霆和公牛

懂球帝浏览 797

还记得“步步高家教机”女孩吗？她暴瘦了15斤？

橘子娱乐浏览 16736

别太担心美股开年的疲软，这可能只是“宿醉”

巴伦周刊浏览 12625

唐斯：很高兴湖人接受了拉塞尔只要你有贡献湖蜜不在乎你的过去

直播吧浏览 19083

大连有梅花鹿连续2天攻击游客受伤女子：我没招惹它

极目新闻浏览 19447

G3掘金15分大胜热火，看赛后马龙、约基奇、布劳恩、穆雷说了啥？

篮球资讯达人浏览 17012

拉总：诺坎普改叫梅西球场？不合适

体坛周报浏览 245

英国以＂支持俄对乌战争＂为由制裁3家中企中方回应

中国驻英国大使馆浏览 12663

张本才腐败时间长达十余年其个人画作曾拍出40万高价

上游新闻浏览 74942

今年秋冬最时髦的穿法：外套+连帽卫衣，减龄又松弛！

LinkFashion 浏览 777

马斯克星链成缅甸电诈“利器”，美国会已启动调查

界面新闻浏览 1042

38岁后单赛季为意甲升班马攻入至少4球，瓦尔迪是历史第二人

懂球帝浏览 287

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

乌记者询问中...

樊小慧前夫否...

这届大美人，...

不穿内衣到底...

口袋 AI ...

特朗普下令重...

台媒：邱国正传递两岸濒临战事的信息示警意味浓厚

冲着陈晓去看《大生意人》，却被满脸狰狞的两位东北跨界演员惊艳

国产药械对外授权交易再现新进展，创下多个“首个”

淘特回应团队大部分人员合并到淘宝：业务有调整，不会并入淘宝

“疲惫脸”太丑了！有这些特征的女生怎么救？

马克龙密会AI专家，法国加入全球人工智能竞赛

刘晓庆怒批演员不背台词，被扒出疑似阿娇，季冠霖曾点名吐槽她

朱民解读硅谷银行破产:金融市场逻辑发生根本变化

乘客说好送还手机付20元反悔司机送到18公里外派出所

新渲染图曝光，消息称iPhone 15 Pro机型泰坦灰将替代金色

王大陆离奇“闪兵”案，搞垮半壁台娱圈

从华为手机之路，读懂华为造车

76人新赛季不败金身被破，全胜球队仅剩马刺、雷霆和公牛

还记得“步步高家教机”女孩吗？她暴瘦了15斤？

别太担心美股开年的疲软，这可能只是“宿醉”

唐斯：很高兴湖人接受了拉塞尔只要你有贡献湖蜜不在乎你的过去

大连有梅花鹿连续2天攻击游客受伤女子：我没招惹它

G3掘金15分大胜热火，看赛后马龙、约基奇、布劳恩、穆雷说了啥？

拉总：诺坎普改叫梅西球场？不合适

英国以＂支持俄对乌战争＂为由制裁3家中企中方回应

张本才腐败时间长达十余年其个人画作曾拍出40万高价

今年秋冬最时髦的穿法：外套+连帽卫衣，减龄又松弛！

马斯克星链成缅甸电诈“利器”，美国会已启动调查

38岁后单赛季为意甲升班马攻入至少4球，瓦尔迪是历史第二人

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

乌记者询问中...

樊小慧前夫否...

这届大美人，...

不穿内衣到底...

口袋 AI ...

特朗普下令重...

台媒：邱国正传递两岸濒临战事的信息 示警意味浓厚

冲着陈晓去看《大生意人》，却被满脸狰狞的两位东北跨界演员惊艳

国产药械对外授权交易再现新进展，创下多个“首个”

淘特回应团队大部分人员合并到淘宝：业务有调整，不会并入淘宝

“疲惫脸”太丑了！有这些特征的女生怎么救？

马克龙密会AI专家，法国加入全球人工智能竞赛

刘晓庆怒批演员不背台词，被扒出疑似阿娇，季冠霖曾点名吐槽她

朱民解读硅谷银行破产:金融市场逻辑发生根本变化

乘客说好送还手机付20元反悔 司机送到18公里外派出所

新渲染图曝光，消息称iPhone 15 Pro机型泰坦灰将替代金色

王大陆离奇“闪兵”案，搞垮半壁台娱圈

从华为手机之路，读懂华为造车

76人新赛季不败金身被破，全胜球队仅剩马刺、雷霆和公牛

还记得“步步高家教机”女孩吗？她暴瘦了15斤？

别太担心美股开年的疲软，这可能只是“宿醉”

唐斯：很高兴湖人接受了拉塞尔 只要你有贡献湖蜜不在乎你的过去

大连有梅花鹿连续2天攻击游客 受伤女子：我没招惹它

G3掘金15分大胜热火，看赛后马龙、约基奇、布劳恩、穆雷说了啥？

拉总：诺坎普改叫梅西球场？不合适

英国以＂支持俄对乌战争＂为由制裁3家中企 中方回应

张本才腐败时间长达十余年 其个人画作曾拍出40万高价

今年秋冬最时髦的穿法：外套+连帽卫衣，减龄又松弛！

马斯克星链成缅甸电诈“利器”，美国会已启动调查

38岁后单赛季为意甲升班马攻入至少4球，瓦尔迪是历史第二人

台媒：邱国正传递两岸濒临战事的信息示警意味浓厚

乘客说好送还手机付20元反悔司机送到18公里外派出所

唐斯：很高兴湖人接受了拉塞尔只要你有贡献湖蜜不在乎你的过去

大连有梅花鹿连续2天攻击游客受伤女子：我没招惹它

英国以＂支持俄对乌战争＂为由制裁3家中企中方回应

张本才腐败时间长达十余年其个人画作曾拍出40万高价