关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1433人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

末节11分!连续7场上双!胡明轩拾巅峰锁胜局,内外线杀伤力拉满

篮球资讯达人 浏览 1475

有魄力!首次先发的向余望等4人,此前出场时间都小于90分钟

懂球帝 浏览 1577

牛弹琴:中国外交干了件大事 王毅的一句话内涵很丰富

现代快报 浏览 23232

硅谷的「十万大裁员」:Meta按代码量裁员

新智元 浏览 2611

古美关系高度紧张 古巴启动"战争状态"

扬子晚报 浏览 1521

乔治亚理工和微软团队重磅推出:让AI推理更聪明的"思维开关"技术

科技行者 浏览 2555

韩版Galaxy S26独享,三星Exynos 2600芯片被曝难以走向全球

IT之家 浏览 2082

财经观察:担忧产业短板,欧盟自查“经济瓶颈”

环球网资讯 浏览 2731

以军多次袭击加沙 哈马斯谴责其违反停火协议

环球网资讯 浏览 2259

俄军中将遭汽车炸弹袭击身亡 目击者:没开几米车突然爆炸

红星新闻 浏览 1892

外媒:法国称“已准备好”向乌克兰派兵

参考消息 浏览 2573

《阿凡达3》不及预期,3个小时全是野人乱跑,排片降了不被看好

萌神木木 浏览 1884

抗日名将孙立人次子已正式向大陆申请 将父亲迁葬故里

环球时报新闻 浏览 14546

M3旅行版上市售94.39万元 告别平行进口

网易汽车 浏览 2402

奥特曼的“印钞机”与“吞金兽”:OpenAI年化营收超200亿美元背后的豪赌

澎湃新闻 浏览 1568

DeepSeek开源新模型:单张A100日处理可超20万页数据

第一财经资讯 浏览 2605

一户人家被全楼"孤立":加装电梯没出资 卖房时尴尬了

扬子晚报 浏览 7292

这波操作太狠了!剪辑连夜删除邓莎路行镜头

娱乐圈笔娱君 浏览 2480

阿里巴巴:全球首个企业级Agent平台“悟空”来了

财闻 浏览 434

问界M8官宣将增瑞红/湛蓝双新色 将于3月23日发布

网易汽车 浏览 447

新款享界S9将于11月7日正式开启预订

车质网 浏览 2023
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1