关闭广告

南洋理工、腾讯等机构联手突破:让AI像人一样"指点"图片中的东西

科技行者2417人阅读


你有没有试过这样的体验:跟朋友聊天时,你想让他看看照片里的某个东西,但又不知道怎么准确描述它的位置?你可能会说"就是那个红色的杯子",朋友却问"哪个红色杯子?"这种沟通障碍在人工智能领域同样存在,而且更加复杂。

由南洋理工大学、腾讯微信视觉团队、新加坡科技研究局等多家知名机构组成的国际研究团队,最近在这个问题上取得了重要突破。他们的研究成果发表在了计算机视觉领域的顶级学术平台上,论文题目是"PATCH-AS-DECODABLE-TOKEN: TOWARDS UNIFIED MULTI-MODAL VISION TASKS IN MLLMS"(arXiv:2510.01954v1),感兴趣的读者可以通过这个编号查阅完整论文。

这项研究解决的核心问题可以用一个简单场景来理解:当你问AI"这张照片里有什么?"时,传统AI只能告诉你"有一只猫、一个杯子、一张桌子",但它无法像人一样直接"指出"这些东西的具体位置。更糟糕的是,当你要求AI找到"桌子上那个蓝色杯子"时,它往往会给出一串看起来很专业但实际上并不准确的数字坐标,比如"[245, 156, 378, 298]",普通人根本无法理解这些数字代表什么。

<
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

吕丽君女儿正脸照罕曝光,犹如翻版刘銮雄!

娱乐团长 浏览 1907

众星在大S雕像前拍照,小S双手合十感谢外界,悼念致辞全场哽咽

萌神木木 浏览 1362

礼来和诺和诺德的“网红减肥药”有望进美国医保!千元减肥药或降价85%

华尔街见闻官方 浏览 2406

马切吉亚尼:迈尼昂扑点的秘诀是米兰的门将教练菲利皮

懂球帝 浏览 2428

10余年持续攻关,为长大隧道配一个智能“消防员”|2024上海市科学技术奖

上观新闻 浏览 1596

日产终于学会“先赢中国市场,再谈全球”

汽车通讯社 浏览 2673

王楚钦退赛:突然背部不适 一度不太能动得了

北京日报 浏览 7332

林永健批顶流进组带编剧乱改戏,网友总结合作演员,成毅被质疑

萌神木木 浏览 2821

你算老几?我算老己!

时尚COSMO 浏览 1909

三季报发布,中国人寿总保费规模创历史同期新高

证券市场周刊 浏览 2653

杨紫胡歌“以命换命”,《生命树》到底讲了什么?

仙女事件簿 浏览 1305

真爱大牌 || 这些被抢空的好物又回来了,这次破价100+

黎贝卡的异想世界 浏览 2056

女子回门宴放父母34年前结婚录像 现场8成宾客曾参加

极目新闻 浏览 9073

上海老人落水获救 4名老人花4天完成"不打扰"的致谢

大风新闻 浏览 7232

伊姐周日热推:综艺《向往的生活-戏如人生》;电视剧《狸猫书生第二季》......

伊周潮流 浏览 2426

美国欲“夺岛”,俄罗斯正“吞地”,中国应做什么?

浏览 25291

业内曝娜扎被抢休息室,刘亦菲聊天被保镖监听,好精彩的后台大瓜

萌神木木 浏览 2432

造人形机器人的公司自己先泼冷水:行业存在过度炒作现象

IT之家 浏览 1802

美媒无法理解:油价这么高 进口最多的中国反而更滋润

书纪文谭 浏览 77777

71岁上海爷叔网恋"小姑娘"转30万 约会遭对方持刀勒索

上观新闻 浏览 16574

利物浦女足前主帅比尔德的葬礼举行,超过六百人参加

懂球帝 浏览 2728
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1