关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1352人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

61岁郭富城现身F1,老了但更有味道了

麦芽是个小趴菜 浏览 476

OpenAI确认旗下首款AI硬件今年发布,形态有望为“一支笔”

IT之家 浏览 1471

克林顿夫妇将就爱泼斯坦案出庭作证 特朗普发声

极目新闻 浏览 103378

2025世界青年科学家峰会聚焦开放合作

新华社 浏览 2582

双十一购物不烧脑!看AI全能搭子荣耀Magic8如何重塑消费体验

新熵 浏览 2628

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

静儿时尚达人 浏览 2343

上海交大吴家睿:复杂的科学时代需要复杂性思维|全国科普月

上观新闻 浏览 3491

12月电车成绩单:小米首破5万大关,蔚来、鸿蒙智行交付再创新高,零跑同增超四成

华尔街见闻官方 浏览 1786

北约:将考虑对俄罗斯发动“先发制人”的打击

环球网资讯 浏览 15495

德国央行行长:与中企的竞争 该让所有欧企彻底醒醒了

澎湃新闻 浏览 2707

伊朗:战争必须以一种让敌人永远不敢再侵略的方式结束

大象新闻 浏览 79081

“麂皮包”越来越流行,秋冬怎么搭都好看

LinkFashion 浏览 1953

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

天天汽车 浏览 1422

曼城外租至斯托克城的穆巴马在对阵QPR时受伤,被担架抬出场

懂球帝 浏览 1564

贝克汉姆家闹出大瓜!豪门大戏再添新章

观察鉴娱 浏览 3164

格拉斯纳:期待与埃泽的碰面,但在比赛中我们只会全力争胜

懂球帝 浏览 2606

俄大使:美袭击时 委防空系统远程预警站通信出问题

参考消息 浏览 1551

美欲推动加沙停火计划第二阶段 专家:既想占好处又不愿担责

环球网资讯 浏览 2700

离婚5年,她真的面相大变

江湖人称艾掌门 浏览 1876

美对委军事打击造成至少40人死亡

界面新闻 浏览 1652

普京:某国准备进行核试验

北京日报 浏览 2704
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1