关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1361人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

E句话|福原爱,再婚怀孕

仙女事件簿 浏览 1872

E句话| 蔡天凤案有判决结果了?

仙女事件簿 浏览 2587

雷军直播拆车,榜一大哥狂送“半辆SU7”

麦浪的玩车之家 浏览 1742

酷睿Ultra 7 255H实战阿里Z-Image-Turbo大模型:1分钟极速出图

IT之家 浏览 1912

CounterPoint称2025Q4印度手机市场联发科斩获48%份额

IT之家 浏览 520

岛内民调:63%台湾民众不愿自身或家人上战场

海峡导报社 浏览 1775

降温了!羽绒服这样穿显瘦又时髦

LinkFashion 浏览 1441

短剧男主遇上长剧男主,谁是天然帅哥谁是滤镜美男,差距一目了然

娱乐圈笔娱君 浏览 2172

伊姐周日热推:电视剧《大生意人》;电视剧《乌蒙深处》......

伊周潮流 浏览 1831

梦碎IPO,又一大忽悠炸雷了

投资家 浏览 2454

美军突袭抓获马杜罗 三个细节值得关注

上观新闻 浏览 1723

特斯拉Model Y低调升级?标配16寸2K大屏+0息政策

大李说车 浏览 1755

茶里回应欠薪:大部分在职员工欠薪兑付已完成,离职员工欠薪问题正分批解决

红星资本局 浏览 1565

美媒:以总理计划说服特朗普帮忙打伊朗

北京日报 浏览 1979

今年秋天最流行“卡其色穿搭”,谁穿谁好看!

LinkFashion 浏览 2726

这件衣服今年太火了!时髦女人都在穿

LinkFashion 浏览 2545

“窝囊”35年没人理!直到遇66岁迟蓬才大火

苏子Vlog一 浏览 1722

法尔克:作为升班马,对阵曼联时拿到一分始终是个不错的结果

懂球帝 浏览 1752

深圳这个人气指标,又爆表了!

博闻财经 浏览 1867

迪马济奥:尤文已与前主帅图多尔解约

懂球帝 浏览 1645

俄大使:美袭击时 委防空系统远程预警站通信出问题

参考消息 浏览 1560
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1