关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻950人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

山东海阳老人扎堆领结婚证现场挤满人 有村庄包车去办

极目新闻 浏览 6919

东体:海港接近签下前全北前锋古斯塔沃,球员当前自由身

直播吧 浏览 12650

车停好就能充 特斯拉:正研发无线感应式充电技术

车界全览 浏览 12952

哈登观战休斯顿迪纳摩美国公开杯半决赛,他是该俱乐部股东

直播吧 浏览 14390

天冷了,“彩色毛衣”这么穿美翻了!

LinkFashion 浏览 713

还记得"欢喜哥"许绍雄吗?嫁女现场堪比TVB台庆!

橘子娱乐 浏览 13346

四个男顶流火了之后怎么变丑了?

想刊刊 浏览 13151

收藏=会了?你可能确诊“电子仓鼠症”

时尚COSMO 浏览 760

官方:马竞签下塞尔塔左后卫哈维-加兰,双方签约至2026年

直播吧 浏览 15787

呼延庆-一个误国误民的历史罪人,老百姓至今把他当大英雄崇拜

趣看热点 浏览 26713

五六十岁女性别瞎穿,教你三步解锁优雅气质,轻松告别油腻感

静儿时尚达人 浏览 814

尼克斯129-101送黄蜂7连败,布伦森33分,哈特22+8+7

懂球帝 浏览 374

加速推进!机器人板块传出大消息!

扬子晚报 浏览 206

东方园林合计被执行1.82亿元,公司被立案股民可索赔

雷达财经 浏览 14863

美抗议者打断布林肯发言 高举"染血双手"呼吁巴以停火

环球时报国际 浏览 81353

美方对中国官员实施签证限制 外交部回应

环球网 浏览 68079

达达“曝家丑”,京东受伤

雷达财经 浏览 12641

修杰楷承认逃兵役!曾花钱造出假病历,贾静雯回应称孩子受到惊吓

萌神木木 浏览 937

诺贝尔奖官方公布爱因斯坦成绩单,鸡汤文原来都是骗人的?

趣看热点 浏览 25692

杜兰特错失关键跳投,篮网两连胜被终结

趣看热点 浏览 25855

余承东首次直播忙着给智界问界带货,称华为智驾体验优于特斯拉

界面新闻 浏览 10972
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1