关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者2579人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

家居巨头杀入汽车圈,为渠道跨界找到新解法

汽车公社 浏览 1618

女子被判向出轨丈夫公开道歉15天 道歉视频引万人围观

大风新闻 浏览 12299

媒体:特朗普暂缓对伊朗动武决定

财联社 浏览 1544

江汽集团董事长项兴初拜访华为任正非,进一步拓宽合作领域

财闻 浏览 1861

香港知名女星惹同性绯闻,和朋友关系举止亲密

你约电影 浏览 1534

陈晓新剧黯然收官!口碑崩塌评论区沦陷,和前妻陈妍希对打输惨了

萌神木木 浏览 1898

击败鲍里妮出线有望为何赛后不庆祝?高芙自揭答案:赢得侥幸

网球之家 浏览 2450

首发权益价5.98万起 星光560动力及安全信息发布

网易汽车 浏览 1895

湖人想要维金斯补充侧翼防守 八村垒+1个首轮签热火能同意吗?

仰卧撑FTUer 浏览 1919

李鸿其王紫璇官宣结婚

扒虾侃娱 浏览 2377

或命名为T1T 奇瑞全尺寸SUV谍照曝光

车质网 浏览 1527

大搞权钱交易和家族式腐败 湖北省委原书记蒋超良被诉

扬子晚报 浏览 74322

曹西平遗体火化,干儿子哽咽道别:谢谢四哥给我的一切

素素娱乐 浏览 1458

美国务卿:希望泰柬下周停火

新华社 浏览 1898

车企增收不增利,钱到哪儿去了

帮宁工作室 浏览 1542

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

静儿时尚达人 浏览 2345

同曦126-123双加时逆转深圳,郭昊文31+6+10,史密斯空砍44分

懂球帝 浏览 1363

下辈子换我长郑恩彩这样好吗?

时尚COSMO 浏览 2088

全智贤与《暴风圈》剧方仍未发文道歉

韩小娱 浏览 3316

高市一度被贴上"安倍女孩"的标签 潜在内阁成员被披露

政知新媒体 浏览 7691

等折叠屏iPhone要再熬两年?郭明錤称恐缺货至2027年

环球网资讯 浏览 1913
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1