关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1621人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

50万往上的车,还用1.5T增程器,车企穷疯了?左右逃不出3个原因

小李车评李建红 浏览 1710

美国政府进入史上"停摆"最长时间 特朗普表态

红星新闻 浏览 15168

77岁大爷孤身赴柬埔寨见网友流浪数日:互联网喊我来的

潇湘晨报 浏览 8313

薛鹤翔:中美欧PPI为什么脱钩?

首席经济学家论坛 浏览 2716

万元损失仅补两千?国投瑞银的补偿,没能让大额投资者“和解”

拾盐士 浏览 835

2026春夏十大流行色

LinkFashion 浏览 1412

【观察】不抱怨、情商高、擅激励,齐沃堪称“宝藏”主帅

体坛周报 浏览 1320

全尺寸货运版eVTOL样机已总装下线,「蓝霄航空」完成新一轮数千万元融资,年内累计融资近亿元|36氪首发

36氪 浏览 2736

广汽回应一半汽车芯片将由格力供应

21世纪经济报道 浏览 1545

AI学会玩游戏,还能像人类一样思考因果关系

科技行者 浏览 1621

沃勒尔:罗马虽然输掉了与米兰的对决,但他们表现更胜一筹

懂球帝 浏览 2402

斯基拉:吉达联合正尝试续约38岁的本泽马,已开出两年新合同

懂球帝 浏览 1582

带病出战,李昊发着烧踢满了U23国足与泰国U23的比赛

懂球帝 浏览 1616

起底Plaud不融资却卖100万台的秘密

虎嗅APP 浏览 2375

蔚来ET5T暗影套装限定版上市 售价31.6万元

车质网 浏览 2616

特朗普:不想“浪费时间”与普京会晤

参考消息 浏览 7869

AI数据中心太火,美商务部长被盯上了,民主党议员发函敦促调查利益冲突

华尔街见闻官方 浏览 1911

不止镜头、手柄,OPPO 推出“行业首款”哈苏专业磁吸闪补光环灯

IT之家 浏览 2663

“史上最长”春节点燃旅游热情 已有心急旅客下单

新京报 浏览 7769

“内鬼”赶走老板!300多亿中国资产,要被抢了

大猫财经Pro 浏览 2741

窦骁何超莲不忍了合体发文,公开回应婚变

一娱三分地 浏览 2541
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1