关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1467人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

腾势D9将迎来第30万辆交付

大象新闻 浏览 2108

TA:阿莫林对3-4-3的执念,从一开始就注定了他在曼联的失败

懂球帝 浏览 1668

衣服完全没有必要越买越多!准备好这3款单品,百搭又舒适

静儿时尚达人 浏览 1645

2026纽约秋冬时装周,在春天开启美的新故事!

LinkFashion 浏览 958

福建一无人岛垃圾泛滥 岛上有140万根玄武岩石柱群

极目新闻 浏览 2778

最新现场:山东舰完成年度最后一次海上训练

环球网资讯 浏览 1931

NVIDIA牢牢把握独显市场92%份额!Intel终于突破1%

快科技 浏览 2088

郭爸曝郭碧婷家庭花销全靠她,嫁入"假豪门"?

代军哥哥谈娱乐 浏览 2750

记者:切尔西已经向塞门约经纪团队进行了初步询价

懂球帝 浏览 1890

存强制退市风险 *ST长药涉嫌财务造假遭立案

北京商报 浏览 2432

谷歌推出开源全栈NPU新架构,旨在实现大模型在终端的低功耗运行

DeepTech深科技 浏览 2687

荣耀Magic8 Pro Air手机线下展出,影像、显示等核心参数公开

IT之家 浏览 1547

“十五五”规划建议:共有15个部分、61条,分为三大板块

国是直通车 浏览 2558

美联储的“十字路口”

21世纪经济报道 浏览 3410

多家银行挂牌信用卡不良资产

中国基金报 浏览 2132

或将搭载V8引擎 奥迪Q9将于2026年发布

车质网 浏览 1620

理财的,注意这两个风险!

米筐投资 浏览 1957

德邦快递实力夺魁:斩获中国跨境电商物流“头程物流标杆企业”奖项

中国经济时报 浏览 2191

中国商业联合会:人工智能加速拓展服务消费新场景

新华社 浏览 1600

小伙河边散步跌落砂石坑溺水双重伤残 家属索赔271万

大风新闻 浏览 2689

纯电续航175公里,吉利银河A7长续航版申报

IT之家 浏览 1614
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1