关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1646人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

天士力前三季心血管板块实现增长

证券市场周刊 浏览 2602

蔚来 ES6 汽车将迎里程碑时刻,第 30 万台今年 11 月交付

IT之家 浏览 2184

中国职业拳击手周润琪在澳乘公交遇袭 头部被刺伤昏迷

三湘都市报 浏览 9339

美防长:已做好战争准备 谁开第一枪就见不到明天太阳

军机Talk 浏览 7477

委内瑞拉外长:伊朗提出"全方位"合作 共同应对美威胁

界面新闻 浏览 1900

乌克兰代表团抵达日内瓦 与英法德官员举行会谈

环球网资讯 浏览 2209

香港科技大学突破文本理解难题:让AI模型内部"自我改造"

科技行者 浏览 1598

维持看涨!摩根大通预计金价明年底均价升至5055美元

第一财经资讯 浏览 2681

超离谱判罚!米内罗进球被吹,马纳法染黄,媒体人:亚冠意义何在

奥拜尔 浏览 2437

百度智能云公布两款自研AI芯片,昆仑芯比外界想象得更有野心

钛媒体APP 浏览 2395

丫邦组合与凤凰组合会师决赛

体坛周报 浏览 3197

“小黑靴”今年冬天又火了!这4组搭配照着搭就很时髦

LinkFashion 浏览 2503

51岁的何炅自曝非常痛苦,如今谁都救不了他?

小梊搞笑解说 浏览 2731

解放军举行围台军演 郑丽文:赖清德把自己的路走绝了

海峡导报社 浏览 23275

鸿蒙智行L3,从架构革命到出行方式重构

汽车公社 浏览 1844

比特币暴跌超20%!43万人爆仓,加密货币市场一片“哀嚎”

北京商报 浏览 2405

高端汽车市场创2亿营收,「悉智科技」拓疆AIDC蓝海 |36氪首发

36氪 浏览 1920

许绍雄情况不乐观!黄宗泽低调现身,佘诗曼落泪取消行程前往医院

萌神木木 浏览 2559

被出示黄牌,西蒙斯社媒晒知名网红uno梗图

懂球帝 浏览 1400

NBA战报:尼克斯134-98狂胜篮网取NBA4连胜,唐斯28+12+2

懂球帝 浏览 2407

阿尔特“AI+数智创造”,汽车设计革命前夜?

禾颜阅车 浏览 1650
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1