关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者854人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美澳关键矿产协议被解读为旨在"对抗中国" 外交部回应

澎湃新闻 浏览 5176

微软85英寸Surface Hub 2S登陆国内市场:售价17.8万

快科技 浏览 25608

一个多月没了342亿,新东方在线持续受挫!俞敏洪慌不慌?

市界观察 浏览 19537

乘联分会崔东树:2025年汽车以旧换新规模预计超1800亿元

IT之家 浏览 34

信贷断崖式加剧紧缩!美国货币供应量连降八个月

华尔街见闻官方 浏览 14327

京东物流上半年总收入778亿元,同比增长32.6%

网易科技报道 浏览 14334

新赛道,世锦赛400米栏冠军博尔宣布将转战女子800米

懂球帝 浏览 1052

卡莱尔:贾雷斯-沃克凭借昨晚表现赢得了上场时间 整场球都有机会

直播吧 浏览 12622

不止复苏:阿里变革后首秀,业绩全面超预期,“价格力战役”不能停

每日经济新闻 浏览 14132

被娃写作业逼疯 妈妈"邪修法"直播写作业引2万人围观

极目新闻 浏览 15479

唐双宁被开除党籍 自称"擅长书法、略通金融"

每日经济新闻 浏览 74474

规模创历史新高 2025浦江创新论坛共议科技未来

看看新闻Knews 浏览 1612

王心凌再回应与吴克群绯闻

半岛晨报 浏览 621

妻子家中枉死丈夫被疑雇凶杀人 27年后真凶浮出水面

环球网资讯 浏览 6170

德国联邦统计局数据显示:今年前8月,中国再成德最大贸易国

环球网资讯 浏览 846

OpenAI 呼吁美国政府将芯片法案的税收抵免扩大至 AI 数据中心

IT之家 浏览 646

王世龙:对方小外援费尔德今天没出战 我们打得比较松

直播吧 浏览 19521

特朗普扬言要撒"关税红利":反对关税的人都是傻瓜

财联社 浏览 6120

高圆圆现身苍蝇小馆 在路边大口啃饭团表情可爱

盖饭娱乐官方号 浏览 19230

刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

爱范儿 浏览 551

女子8名亲戚在地震中遇难:有人前2天还和我说话

北青深一度 浏览 74517
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1