关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者1588人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被问是否会刺杀伊朗新领袖 特朗普突然"共情"了

极目新闻 浏览 31973

福特在华渠道大整合,能否激发出新动力?

禾颜阅车 浏览 2597

新款阿维塔12实车首曝光 华为靳玉志评其脱胎换骨

网易汽车 浏览 1529

金鸡奖名场面!第1排大佬坐镇,咏梅表情管理,袁弘第5次当锦鲤

娱乐圈笔娱君 浏览 2279

阿莫林将执教曼联3年!卡拉格开炮:没人相信拉爵,这么说太过火

奥拜尔 浏览 2720

全力向上!重庆铜梁龙赛季最后一个主场将展示全场拼图TIFO

懂球帝 浏览 2616

每3辆出口摩托就有1辆“重庆造”:“摩都”走向世界了!丨这座城市有点东西

国是直通车 浏览 3372

产检时一切正常小孩出生后却畸形 母亲时隔一年多投诉

潇湘晨报 浏览 7607

周杰伦昆凌晒照庆结婚11周年,夫妻合照很甜蜜,与家人庆贺很温馨

笑猫说说 浏览 1588

高德杀入美团百度腹地,马云其实要和刘强东大决战?

BT财经 浏览 2462

巴铁用中国武器击落阵风后,印度信心崩溃

浏览 6309

六台:马竞认为巴萨无力支付小蜘蛛的转会费,计划围绕其建队

懂球帝 浏览 2101

将提升极端场景识别度 小米汽车召回超11万台SU7标准版

网易汽车 浏览 3544

被曲解的雷军:“安全至上”与“好看第一”并不冲突

虎嗅APP 浏览 2232

以政府:以色列被扣押人员10月11日起获释

界面新闻 浏览 2823

翁青雅被官媒点名,不是夸是批评,言辞直戳其肺管子!

娱乐圈笔娱君 浏览 2456

卡罗拉锐放价格再下探!网友:这次真心动了

汽车网评 浏览 1557

货拉拉跑腿骑手取走万元苹果手机后失联 手机店主发声

红星新闻 浏览 7819

一个长城战略下,哈弗重塑命名体系

帮宁工作室 浏览 2594

学者:此次"正义使命"演习最大的亮点就是"开局即打"

环球网资讯 浏览 23201

大S雕像揭幕仪式曝光,S妈具俊晔雨中挽手同行,前夫汪小菲未露面

扒虾侃娱 浏览 1369
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1