关闭广告

卡耐基梅隆大学发现让AI更聪明的秘诀:犯错后自我纠正

科技行者1558人阅读


当我们在学习数学时遇到难题,通常不会因为最终答案错了就把整个解题过程全盘否定。相反,我们会仔细检查每一步,找出哪里出了问题,然后重新思考那个关键步骤。然而,现在的大型语言模型(就是那些能和我们对话的AI)在学习推理时,却一直在做着"一刀切"的事情——要么整个过程都是对的,要么全部都是错的。

这项由卡耐基梅隆大学领导的研究于2026年1月发表,论文编号为arXiv:2601.14209v1,研究团队发现了一种让AI更聪明的训练方法,称为"干预训练"(InT)。这种方法教会AI在犯错时进行精准的自我修正,就像一个优秀的学生能够发现自己解题过程中的具体错误并加以改正。

在传统的AI训练中,就好比一位严厉的老师,看到学生的数学题最终答案错了,就会说"整道题都重做",不管学生前面九步都做对了,只是最后一步计算失误。这种训练方式的问题在于,AI无法准确判断自己到底哪里出了问题,也不知道应该如何精确地改进。

研究团队提出的干预训练方法则像是一位耐心的导师。当AI在解决数学问题时出现错误,这个方法会帮助AI找到第一个出错的步骤,然后提出一个具体的修正建议。关键在于,这个修正建

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

销量五年连跌,转型未起色,为何日系车最“困难”的是本田?

汽扯扒谈 浏览 1662

增持回购潮背后的A股信心

北京商报 浏览 2193

广东110-105深圳4利好!陈家政焦泊乔证明价值,萨林杰统治关键球

篮球资讯达人 浏览 1690

皮尔斯:如果我和詹姆斯年纪相同,他绝对不可能拿到4座冠军

懂球帝 浏览 2629

NBA球员工会:我们与明州人民站在一起,必须捍卫言论自由的权利

懂球帝 浏览 1465

翁帆:杨先生离开时一定很欣慰 他交出了份满意的答卷

光明日报 浏览 6177

刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

爱范儿 浏览 2337

波士顿动力人形机器人亮相CES 拟2028年进厂造车

网易汽车 浏览 1701

花一个月工资买节日礼物,值吗?

时尚COSMO 浏览 1743

从“提效”到“稳进”:2026直播电商进入精耕细作时代

惊蛰研究所 浏览 1545

特朗普:加沙停火协议“非常接近达成” 本周末或去中东

央视新闻客户端 浏览 16715

负债数亿,足力健卖食品要开20000家店

中国企业家杂志 浏览 2462

新增插混系统 全新斯柯达柯珞克假想图曝光

车质网 浏览 1353

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 1635

特斯拉涉嫌虚假宣传驾驶辅助,或被禁售30天

汽车公社 浏览 1809

在南海坠毁的美军机比F-35还贵 单价1亿美元

参考消息 浏览 1915

大A里程:3.15万亿,4120点,十年新高

正经社 浏览 1654

伊姐周日热推:电视剧《声渊》;电视剧《绝境通缉令》......

伊周潮流 浏览 2019

10月新势力销量爆发:零跑首破7万辆,小米稳超4万辆,理想猛跌38%

21世纪经济报道 浏览 2462

「新消费观察」折扣店洗牌开始?好特卖多地闭店:“高成本选址”与“低价模式”矛盾凸显

华夏时报 浏览 1914

刚刚!利好,直线暴涨!

中国基金报 浏览 1435
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1