关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2821人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

多品牌疑"删除"张雨绮代言内容 此前其被实名举报代孕

现代快报 浏览 5164

澳网最具看点女单比赛来了!莱巴金娜谈迎战斯瓦泰克:保持进攻

网球之家 浏览 1444

甘肃退伍老兵,抱紧黄仁勋,狂揽上千亿

华商韬略 浏览 1532

熊园:10月新房和二手房销售均走弱

首席经济学家论坛 浏览 2451

朵朵和小酒窝合体出道,才明白她下了一盘大棋

观察鉴娱 浏览 3251

双星鞋业84岁创始人宣布断绝父子关系:儿子抢公章夺权

红星新闻 浏览 9320

阿里联合上海交大:一个训练样本就能让AI变"学霸"的惊人发现

科技行者 浏览 1596

足球报:曾有公司有意收购广西平果,但因欠账问题方面没谈拢

懂球帝 浏览 1826

一年连关两厂,风靡全国的顶流养乐多为啥没人买了?

江瀚视野 浏览 2361

香港火灾现场明火已逐渐被扑灭 消防员将开始上楼搜救

每日经济新闻 浏览 32452

小伙雕刻"全球首个汽车石窟" 曾雕"奥特曼"石窟引争议

封面新闻 浏览 8293

为年轻用户打造Dream Car,零跑推出纯电掀背轿跑

Report汽车 浏览 2436

美军参联会主席警告:对伊朗动武可能带来重大风险

央视新闻客户端 浏览 889

媒体:泽连斯基妥协 刚冻结俄资产的欧洲"惊觉一场空"

上观新闻 浏览 18698

中美俄都不想的事出现 欧尔班面临下台特朗普力保没用

博览历史 浏览 12800

芦哲:经济“温差”如何影响宏观调控?

首席经济学家论坛 浏览 2611

赛力斯今日成功在香港主板上市 张兴海:开拓中国高端车全球新赛道

证券市场周刊 浏览 2454

今年最流行的5条半裙,怎么搭都好看!

LinkFashion 浏览 601

OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作

量子位 浏览 2684

斯普利特:杨瀚森暂未100%与球队同步,但他整体表现是正面的

懂球帝 浏览 1864

估价21万元奔驰车将被1元起拍 系涉刑资产

红星新闻 浏览 8304
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1