关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2484人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英超第8轮最佳球员候选:马奎尔、哈兰德、萨卡、内托在列

懂球帝 浏览 2679

狂砸30亿!阿里千问官宣“春节请客”计划,吃喝玩乐全免单

雷科技 浏览 1291

理想「断腕」:关店100家,李想手里还剩什么牌?

电车通 浏览 1425

报告称机械硬盘价格触底反弹,平静2年后将迎新一轮涨价潮

IT之家 浏览 2021

黄慧颐晒结婚证回击保剑锋,业内下场曝猛料,女方曾持刀捅伤男方

萌神木木 浏览 1594

王大陆逃兵役案新后续,贾静雯老公受牵连

查尔菲的笔记 浏览 2208

智能体系统如何「边做边学」?斯坦福团队探索在线优化的新范式

机器之心Pro 浏览 2622

香港浸会大学推出AlphaApollo:AI实现协同推理突破

科技行者 浏览 2506

星纪魅族前美女副总裁,转投小米公关部

财通社 浏览 786

李立群回应三个孩子都没结婚

大眼妹妹 浏览 2219

女子开宝马住高端小区却偷榴莲 保安提醒后她又拿2件

潇湘晨报 浏览 89735

2025秋冬最火的5件外套,今年流行的风格都离不开它们!

LinkFashion 浏览 4439

欧阳明高警示:中国车企转型需防范“欲速不达”

观察者网 浏览 418

李金羽:冲超没那么容易,希望球员们勇敢地面对各种情况

懂球帝 浏览 3285

媒体:中国该如何在军事部署上经营台湾 如今值得思考

新民周刊 浏览 6919

玲花时隔4个月单人复出,曾毅近照憔悴暴瘦,凤凰传奇合体艰难

萌神木木 浏览 2098

年度最扎心电影,看得中年男女坐立难安

Yuki女人故事 浏览 1587

上千家美国企业排队"退税" 尴尬的美国关税战试图挽尊

第一财经资讯 浏览 37237

暖心!海鸥飞过球场被皮球击中晕倒跌落,球员做心肺复苏将它救活

风过乡 浏览 928

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 2757

李佳航、印小天拍短剧?还是穿越题材

最爱酷影视 浏览 2728
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1