爆点资讯

当我们训练人工智能写代码或解数学题时，就像教小孩做作业一样，需要给它很多练习题。但问题来了：有些题目太简单，AI一下就会了；有些题目太难，AI怎么也学不会。更麻烦的是，按照传统方法，不管题目难易，我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间，也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队，在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器"，让它能够根据题目难度自动分配练习时间，既不浪费计算资源，又能确保每道题都学得扎实。

研究团队的核心发现是：当前主流的AI训练方法GRPO（组相对策略优化）存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时（要么全对要么全错），系统就收不到有用的学习信号，就像老师看到学生交上来的作业要么全是满分要么全是零分，无法判断学生的真实水平。

为了解决这个问

AI让机器写代码变得更聪明：伊利诺伊大学团队破解训练瓶颈新方法

多名陌生男子...

外资公募绩优...

国米vs凯拉...

双雄对决，最...

刘备为何能三...

京鲁大战在即...

杜兰特：超巨不在于名号而在于表现我想一直打球直到再也打不动

杨学增：连续客战使队伍出现一些伤病和疲劳与浙江实力差距较大

巨星传奇想摆脱“周杰伦依赖”

还能怎么吹？球迷盛赞梅西：GOAT效应，让其他人赢一赢吧

钟嘉欣携全家游越南，三代同堂幸福满溢，父母海边高调撒糖超甜蜜

荣梓杉塌房太离谱！出轨家暴还反咬？

上海双雄克星！艾曼3战独造5球，助攻双响后被队友“擦鞋”

大一新生开学不久在校死亡家长在医生的建议下报警

国产“万吨大驱”直面“硬仗”

跨界电动SUV，长安启源E07申报图曝光

权志龙正式回应吸毒，将主动接受毛发检测证清白

“北溪”爆炸案一嫌疑人被引渡至德国受审

短剧副导演拍摄结束两天后在家猝死两女儿刚放学回家

福建舰最新画面披露台湾媒体直呼“震撼”

神秘买家3亿多买北京海洋馆不付钱公司注册地在小区

原来牛仔裙才是春夏最减龄的单品

广安爱众0元收购一新能源发电公司90%股权

是时候考虑购买美国大豆了，为了“拴住”特朗普！

德媒：王毅在慕尼黑表态＂极为自信＂发言非常轰动

买彩票，年轻人信仰的新玄学

沉闷冬日需要有色彩的穿搭，咱们也做一次好“色”之徒。

小插曲，威尔士对比利时的世预赛中有老鼠入场短暂干扰了比赛

掘金G3大胜热火！约基奇穆雷统治内外，布劳恩奇兵，双波喜忧参半

8月24日，世界干了一件大事！