关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2735人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

看完这些上镜穿搭,国庆“美美出片”不费力

黎贝卡的异想世界 浏览 4271

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 5615

地平线苏箐:3年后 准L4级系统大概率已经量产

网易汽车 浏览 2034

俄称击退乌军解围行动 乌称击退俄军进攻

国际在线 浏览 2305

5万美元筛选「超级婴儿」, 智商提升15点?马斯克被曝是客户!

新智元 浏览 2656

英伟达能救英特尔吗?

华尔街见闻官方 浏览 3491

徐彬:邵指导是第一个想让我出去踢球的;拿手菜有把子肉

懂球帝 浏览 1330

杜若溪一家海外度假,老公和女儿一起出镜

小小一米月儿 浏览 1849

刚刚!利好突袭,直线爆拉!

中国基金报 浏览 2556

女生被同学殴打13次后确诊精神分裂 当地启动全面复查

大风新闻 浏览 7705

日本新一代货运飞船 HTV-X 首飞,为国际空间站送“快递”

IT之家 浏览 2687

特朗普称可能将军事行动扩大到墨西哥和哥伦比亚

大象新闻 浏览 2030

特朗普对全世界一视同仁,中美关系未必会更糟

浏览 25311

晕了晕了!机构大动作调仓,55只行业主题ETF被疯狂扫货,而热门的半导体竟被悄然抛售

每经牛眼 浏览 2351

票房会破10亿?看完《阿凡达3》后,我极其冷静地,写下这篇文章

皮皮电影 浏览 1831

纳瓦拉同平台/油耗6.8L 郑州日产金锐骐上市8.68万元起

网易汽车 浏览 1548

郎酒9月发布的会员尊享酒,为何成懂酒人的优选?

金角财经 浏览 2701

锡安复出生涯首次替补18+6 鹈鹕送公牛9战第8败吉迪11+7+5

醉卧浮生 浏览 1916

3年半亏损289亿,华侨城A换帅,人均薪酬15.5万元

华美财经 浏览 3464

美国务院批准向波兰出售“标枪”导弹系统

国际在线 浏览 2975

李湘为女铺路太过,带16岁王诗龄,硬往何超琼霍启刚等大佬圈层挤

不八卦会死星人 浏览 1939
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1