关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11351人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英超:维拉3比1富勒姆取联赛首胜

体坛周报 浏览 1460

春晚重播,把她推上巅峰

她刊 浏览 13243

国产车市场占有率超过60% 合资车降价也不香了?

汽车扒壹扒 浏览 10840

小米汽车终于“上岸”?

虎嗅APP 浏览 14376

省级农信社改革再添一例:海南农商银行成立,选择统一法人模式

经济观察报 浏览 12253

华为“引望”来了

盖世汽车 浏览 12253

城镇化率突破67%,城市发展转向存量优化,自然资源部:将发布规划指南

时代周报 浏览 1565

和沈腾争冠军!时隔六年,徐峥新片要杀回暑期档?成本超2亿

靠谱电影君 浏览 11101

人大代表建议公共场所室内全面禁烟,保护公众不受烟草烟雾危害

趣看热点 浏览 338760

微软CEO纳德拉:全球正在就人工智能形成广泛共识

网易科技报道 浏览 12654

王祖贤昔日好友戴蕴慧揭秘往事:我们一起经历的有趣事情

素素娱乐 浏览 12564

经纪公司否认玄彬孙艺珍离婚 怒斥假新闻过于离谱

网易娱乐 浏览 19825

荷兰宣布实施,中国大使馆:坚决反对!"国家队"重磅出手

证券时报 浏览 15386

银行存款利率下调 年轻人跨城存钱:50万能多赚6000元

上观新闻 浏览 116597

放弃“模仿”,小米汽车的价值才能显现

盖世汽车 浏览 10906

购置税从“免征”到“减半”,新能源车企将迎来一场考验!

百姓评车 浏览 968

马斯克星链成缅甸电诈“利器”,美国会已启动调查

界面新闻 浏览 977

女子信男子是"神仙"陪睡数月为老公治病 还让他住进家

汉史趣闻 浏览 63028

杜特尔特警告:美军基地协议或将使菲"成为坟场"

参考消息 浏览 15972

身高从来不影响穿搭,看这位40+小个子博主的搭配,简单时尚养眼

Yuki时尚酱 浏览 12741

心灵奇旅票房破2亿,豆瓣评分接近9分

趣看热点 浏览 25852
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1