关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者782人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

给过去10年最好的谍战剧排个名:《沉默的荣耀》第6,《风筝》第2

皮皮电影 浏览 570

扒扒爆火的《繁花》穿搭,90年代的她们好时髦

黎贝卡的异想世界 浏览 14227

美太空军将首次参演“乙支自由之盾”

海外网 浏览 14576

沈飞官宣歼-31B新型隐身战机 披露关乎空战的重要细节

政知新媒体 浏览 63892

欧足联预测欧冠首发:马赫雷斯格10配哈兰德 劳塔罗搭档卢卡库

直播吧 浏览 19065

售11.44万元起 起亚新K3两款特别版车型上市

网易汽车 浏览 12260

陈赫庆生照里看不到鹿晗?

韩小娱 浏览 637

知名港圈女神近况曝光 被指皮肤松弛显老态

港剧剧透社 浏览 19365

爆火的“表演饭”,开始被年轻人避雷

餐饮老板内参 浏览 990

美军大兵压境 委内瑞拉发现一邻国与中情局勾结

上观新闻 浏览 757

面向“年轻品味前行者”,启辰大V推出“年轻潮力量”

BusinessCar 浏览 20333

清华团队破解:大模型训练崩溃之谜

科技行者 浏览 652

波尔图主帅孔塞桑:国米强手如云,与他们的比赛苦战在所难免

直播吧 浏览 19370

认真生活的18个锦囊妙计:

黎贝卡的异想世界 浏览 2067

泽连斯基承认袭击克里米亚大桥 俄杜马议员:可耻

海外网 浏览 14337

《日掛中天》首波口碑!剧情被质疑渲染苦难,辛芷蕾演技获肯定

萌神木木 浏览 705

惹怒"希尔顿们"的酒店代订:有商家的价格便宜近千元

潇湘晨报 浏览 68009

古尔曼:苹果今年WWDC不会推出类似于ChatGPT的竞品

IT之家 浏览 19050

以军在加沙地带发现迄今最大规模哈马斯地下隧道

环球网资讯 浏览 13313

里沙利松:踢日本要展现出与踢韩国一样的强度

懂球帝 浏览 1025

中国第四艘航母是否核动力 海军政委回应

北京时间 浏览 12083
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1