关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2822人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国家级5G智慧工厂背书,全新深蓝S07上市交付

经济观察报 浏览 3501

透视四川政府工作报告:向“第四极”加速奔跑

尺度商业 浏览 1358

175款智慧康养机器人产品将亮相成都!记者提前探馆带你体验

红星新闻 浏览 2686

跑调风波越演越烈!沈佳润被网友喊话

萌神木木 浏览 1763

黎巴嫩真主党证实其高级领导人遭以军空袭身亡

环球网资讯 浏览 2262

今年秋冬流行“漏斗领外套”,时髦又高级!

LinkFashion 浏览 2310

韩国防部给出核潜艇下水时间点 此前韩国已向中方保证

澎湃新闻 浏览 15100

大衣里面穿什么?这件内搭才是今年冬天的“顶流”

LinkFashion 浏览 1455

日本前首相石破茂再批"日本拥核"言论

界面新闻 浏览 1817

高市落泪称让民众不用担心中国 关键时刻金正恩出手了

时时有聊 浏览 20801

测Manus 1.5:丝滑,超预期,Manus独特上下文工程的一次关键展示

硅星人 浏览 2764

2026年最火单品,竟然是一只20年前的机车包?

LinkFashion 浏览 1678

39岁李思思离开央视两年,商演小县城不摆架子

范櫳舍长 浏览 815

A股板块轮动加速 基金净值“跑偏”泄露调仓动向

证券时报 浏览 3254

泽连斯基新年致辞:不要"乌克兰的终结"

中国经济网 浏览 1761

何晴去世后续:儿子出生户口不能上自己家

古希腊掌管月桂的神 浏览 2026

业主反映多户顶楼业主违规加盖房屋 持续多年无法拆除

红星新闻 浏览 6468

美联储的“十字路口”

21世纪经济报道 浏览 3410

收藏=会了?你可能确诊“电子仓鼠症”

时尚COSMO 浏览 2406

苹果发布iPhone 17e,起售价4499元

澎湃新闻 浏览 759

李想评豆包手机为现象级AI产品 努比亚回应:带来自动驾驶式体验升级

快科技 浏览 1322
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1