关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1612人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

曾获专班支持的“座上宾”,如今被追要1.4亿元投资款!光伏龙头50亿元项目推进不利,收地方政府“听证通知书”

每日经济新闻 浏览 1811

北京独生女被男友殴打致残:他让我再买房写他儿子名字

黄河新闻网吕梁频道 浏览 7469

30岁后越来越美的女人,只穿滋养自己的衣服

LinkFashion 浏览 3460

提供两种动力 日产NX8有望于3-4月上市

车质网 浏览 1472

响应市场需求,积极推动中加经贸合作

国是直通车 浏览 1584

致敬,齐达内送给法国10000米冠军格雷西耶一件签名皇马球衣

懂球帝 浏览 3239

2026年新年首个工作日 中纪委连打4“虎”

南方都市报 浏览 8917

今年秋天最火的4条裙子,配玛丽珍鞋绝美!

LinkFashion 浏览 2702

精致智能代步车 零跑A10还有激光雷达

网易汽车 浏览 1597

大疆Osmo Pocket 4云台Vlog相机被曝3月发布,分标准/Pro版

IT之家 浏览 1594

仅仅是 AI,并不能让硬件更「智慧」,更重要的其实是这个

极客公园 浏览 2613

全新宝马X5更新归来!起售价下探至不足60万,轴距超3米1,很亲民

小史谈车 浏览 1377

爱马仕的暮色时分有多美?

时尚COSMO 浏览 618

车标比界“少一角”,华为系“境”与“界”差别在哪?

汽扯扒谈 浏览 1442

77岁大爷孤身赴柬埔寨见网友流浪数日:互联网喊我来的

潇湘晨报 浏览 8298

A股董事被拘!涉嫌违法放贷,早年工行履历被关注

财通社 浏览 2837

奔驰A级车延至2028年,新车型同步推进

MOTO 浏览 3295

「新消费观察」折扣店洗牌开始?好特卖多地闭店:“高成本选址”与“低价模式”矛盾凸显

华夏时报 浏览 1905

2025中国金帅奖候选名单:邵佳一、于根伟在列,常卫魏入选

懂球帝 浏览 2002

专访顶新便利餐饮 游仁宏:便利店的核心壁垒,是人与温度

新零售财经 浏览 2695

林心如揭秘:霍建华宠女无度,对自己超抠?

科学发掘 浏览 2104
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1