关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1649人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美顶级战机制造商干涉台湾被大陆制裁 进入"慢性死亡"

博览历史 浏览 5076

鸿蒙智行的上限,该重新评估了

汽车公社 浏览 2055

赖清德只字不提台湾光复 还在公然纪念"古宁头战役"

海峡导报社 浏览 8130

北京拿下“五万亿之城”,为何还成了AI之城?

BT财经 浏览 917

千问加速进入AI硬件!再推1999元亲民AI眼镜,减价不减配

智东西 浏览 1894

伊朗被指愿作出让步:将最高丰度浓缩铀的一半送至国外

环球网资讯 浏览 37043

抗癌不到一年,刘谦近况曝光,憔悴到认不出

乡野小珥 浏览 1525

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家 浏览 3410

秋天上班族应该怎么穿衣?衬衫为主、打造腰线,利落又得体

静儿时尚达人 浏览 2797

33岁的张一山惊艳亮相,杨紫这次真得避嫌了?

探长影视解说 浏览 2462

里程碑!刘铮生涯总抢断超越西热力江,升至CBA历史第13位

懂球帝 浏览 1484

乌迪内斯主帅:扎尼奥洛重返罗马会很激动,即使不是罗马每个人都喜欢他

懂球帝 浏览 2433

最新!这家险资巨头,透露康养生态布局进展

券商中国 浏览 1817

伊朗最高领袖顾问:特朗普理应担心有更多美国人伤亡

环球网资讯 浏览 38766

不确定的时代里,亚马逊广告如何重构确定性?

有数DataVision 浏览 1899

从一秒起身的机器人到降本80%的数据,鹿明机器人破解具身机器人智能化困境

雷峰网 浏览 1686

频曝食安问题、高管IPO前套现1.3亿!鸣鸣很忙上市太急?

互联网那些事 浏览 1584

俄乌“和平计划”又生变 欧洲“强有力”回应特朗普批评

环球网资讯 浏览 2066

一千多人牺牲结局,无法改写,但于和伟临刑前一个动作,升华全剧

皮皮电影 浏览 2654

终于在广州最舒服的季节和你们见面啦

黎贝卡的异想世界 浏览 1934

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 3417
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1