关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者771人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

席琳·迪翁姐姐称其病情恶化 已无法控制自己肌肉

维音帝 浏览 13091

投资者情绪低迷 上证报:要有买在"无人问津处"的勇气

政知新媒体 浏览 77965

人工智能时代,应警惕“思维钝化”

环球时报国际 浏览 12327

欧盟试图"全面淘汰"俄能源 斯洛伐克总理:自我毁灭

环球网资讯 浏览 1475

哥伦比亚总统硬刚特朗普:不要用军事行动惊扰“美洲豹”

红星新闻 浏览 180

2025秋冬最火的5件外套,今年流行的风格都离不开它们!

LinkFashion 浏览 2115

外交部:中美双方同意努力实现两国元首会晤

环球网 浏览 81715

媒体:向美军舰发射导弹 胡塞武装不是"软柿子"

澎湃新闻 浏览 76202

卢卡申科:若普京被逼得走投无路 俄就可能使用核武器

每日经济新闻 浏览 90421

美媒称美国允许乌对俄使用远程导弹 特朗普:假新闻

界面新闻 浏览 810

NBA新赛季大前锋TOP10:字母一枝独秀 浓眉盼健康

体坛周报 浏览 911

50岁女性冬季穿衣指南:避开 2 大禁忌,这样得体又时髦

静儿时尚达人 浏览 185

记者:新月为米神报价5500万欧元,富勒姆的理想价位是6000万欧元

直播吧 浏览 14349

今年第三次!53万的理想MEGA烧了,奶爸:不敢想象

说财猫 浏览 859

核酸检测企业开始打官司讨债了

界面新闻 浏览 15728

男子强奸大嫂出狱再杀人案启动再审 高院披露详情

南国今报 浏览 11596

不变应万变!曼城连续3场首发不变,为瓜帅执教以来第三次

直播吧 浏览 1556

售28.99万起 凯迪拉克新CT6配置大升级

网易汽车 浏览 809

职场“关系户”还值得羡慕吗?

识局 浏览 914

与美主持人激烈辨论后被闭麦 万斯怒了

环球网资讯 浏览 4994

软银清仓英伟达,孙正义套现415亿

YOUNG财经 浏览 633
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1