关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11353人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

刘涛女儿近照曝光,这才是“顶级富养”的典范!

动物奇奇怪怪 浏览 993

比亚迪4S店:宋L DM-i八月上市!没想到价格这么低

爱卡汽车 浏览 10374

月销破7万台!汽车圈外行朱江明,成新势力大赢家

象视汽车 浏览 545

延迟写《南京照相馆》?好电影,确实是对比出来的

娱乐官已上任 浏览 1613

此前5年常规赛库里每场至少命中1记三分 近1个月已2次三分0中

直播吧 浏览 12765

日娱圈惹争议!男偶像被要求肢体骚扰未成年女粉,粉丝欲卖身追星

文艺圈娱乐号 浏览 13093

司马懿伐辽东留残局隋唐两朝困扰50年!唐太宗也头疼

趣看热点 浏览 25560

波音圣路易斯地区罢工持续近三月,谈判陷入僵局

国际金融报 浏览 797

德容:梅西曾是我的偶像,对我来说他是史上最佳

懂球帝 浏览 957

微软OneDrive AI人脸识别功能引争议:每年仅允许用户关闭三次

IT之家 浏览 979

第二十七届高交会将于下周举办,中国太空游项目将全球首发

南方都市报 浏览 703

西方14国发布联合声明 有乌克兰参与但没有美国

新民晚报 浏览 6466

26岁甜美女星自曝去看妇科被男医生骚扰!直呼:超想吐、超可怕

文艺圈娱乐号 浏览 12884

胜者为王!德卡大战让法网提前进入狂欢模式,德约和阿卡你挺谁?

网球之家 浏览 16657

美团收购光年之外,给朱啸虎做了注脚

字母榜 浏览 15587

传Blackwell架构GB20x的GPC配置基本不变,英伟达仍在开发GB205/6/7

超能网 浏览 11250

东风计划2026年将欧洲销量提升至8万辆

盖世汽车 浏览 1467

墨镜,一种i人才懂的顶级时尚偷感

YOKA网 浏览 11147

松弛的北京中产,占满了朝阳公园的草皮

INSIGHT视界 浏览 16631

科曼:让贝尔温首发是希望他在内线有更多移动

懂球帝 浏览 10403

女子信男子是"神仙"陪睡数月为老公治病 还让他住进家

汉史趣闻 浏览 63032
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1