关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1465人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

苏丹快速支援部队宣布同意实行人道主义停火

国际在线 浏览 2436

“下沉剧宣”越来越不好用了?

时尚COSMO 浏览 1837

恩智浦全新S32N7处理器释放软件定义汽车(SDV)的全部潜力

HiEV 浏览 1697

A股突发!刚刚,释放三大信号!

券商中国 浏览 2715

美媒:中美之间一个变化正在显现 欧盟总部相当纠结

环球时报国际 浏览 12037

东风本田10月销量28896台 1-10月累计终端销量255073台

网易汽车 浏览 2493

痛批落马副市长的市长也落马了,你别笑

识局 浏览 1405

超300倍就清零!超高位科技股突然暴跌,中芯国际重挫7%

深蓝财经 浏览 2712

50+姐姐别乱穿!这4个秋天“显贵”的搭配思路,越老越有韵味

静儿时尚达人 浏览 4250

崔东树:2025年全国汽车市场总体走势较强 新能源商用车景气度走高

智通财经 浏览 1979

Beats苹果iPhone 17e专用保护壳发售,399元

IT之家 浏览 772

皇马官方:卡瓦哈尔比目鱼肌受伤

体坛周报 浏览 3183

联合杯贝尔赫斯首胜阿利亚西姆

体坛周报 浏览 1602

冬天穿衣既要有温度又要有风度!看看这些穿搭,优雅又显瘦

静儿时尚达人 浏览 1596

下辈子换我长郑恩彩这样好吗?

时尚COSMO 浏览 2088

艾弗森怒斥轮休:让我轮休?那xx是一场比赛,有种训练也让我休息好了

懂球帝 浏览 2768

估价21万元奔驰车将被1元起拍 系涉刑资产

红星新闻 浏览 8301

塞萨洛尼基大学推出MBC:让AI大脑像U盘一样随时扩容

科技行者 浏览 1429

今年最时髦的穿法:长外套+长裤,太高级了!

LinkFashion 浏览 1340

航行警告:南海海域有火箭残骸坠落 禁止驶入

央视军事 浏览 2108

“麂皮包”越来越流行,秋冬怎么搭都好看

LinkFashion 浏览 1954
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1