关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者1589人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奇瑞再次否认与追觅合作:双方并未进行合作签约

IT之家 浏览 1748

23岁硕士徒步因高反去世 刚出现症状时没有听劝下撤

红星新闻 浏览 7384

千亿豪赌,甲骨文会成“甲骨文”?

每日资本论 浏览 2015

空间实用/补能高效 吉利蓝气球限时钜惠价3.99万元起

网易汽车 浏览 2636

国足出战FIFA系列赛!媒体人热议:托国际足联福,别一直闭门造车

奥拜尔 浏览 1663

广汽集团:9月份销量173176辆,同比下降 5.17%!

车秀小咖 浏览 2819

鸿蒙版微信一周年:从“能用”到“好用” 超2000万下载量背后的进化史

快科技 浏览 2678

今年秋冬流行“漏斗领外套”,时髦又高级!

LinkFashion 浏览 2307

国家医保局:职工医保个人账户跨省共济今年全国覆盖

商业观察杂志社 浏览 790

国投瑞银被起诉背后

时代周报 浏览 1528

牛弹琴:美印突然和好 一个与俄方有关的细节很不寻常

现代快报 浏览 4900

离婚真相曝光不到2月,“一言不发”的唐嫣,给娱乐圈上了一课

金风说 浏览 1561

闫学晶奢侈风波升级!官媒出手锐评

网络易不易 浏览 1654

"韩国顶流"被追缴200亿韩元税款:至少赚了1000亿韩元

新民周刊 浏览 2728

张馨予晒妈妈织的围巾!被称呼为宝宝好幸福

阿雹娱乐 浏览 1354

活塞121-90狂胜送尼克斯四连败,坎宁安29分13助,布伦森25分

懂球帝 浏览 1644

“811汇改”十周年的成就

证券市场周刊 浏览 2769

雪落航天城!航天员呵护航天娃,航天人守护航天城

我们的太空 浏览 1548

这些才是适合普通人的穿搭!秋天多穿蓝色单品和风衣,好耐看

静儿时尚达人 浏览 2551

罗马诺:切尔西接近聘请前利物浦球探总监戴夫-法洛斯

懂球帝 浏览 2624

清华教授:高市狂言是对中国武力威胁 暴露日危险走向

上观新闻 浏览 5720
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1