关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2816人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普:若俄乌冲突无法解决 可能会供乌“战斧”

界面新闻 浏览 2714

乌迪内斯主帅:扎尼奥洛重返罗马会很激动,即使不是罗马每个人都喜欢他

懂球帝 浏览 2425

专家:自民党与公明党谈崩了 给高市早苗当头一记闷棍

澎湃新闻 浏览 2823

男子吐槽一家医院"收费贵"遭起诉 被判"道歉并赔偿"

封面新闻 浏览 36645

谭松韵,为什么百搭?

温柔娱公子 浏览 1864

思聪生日宴曝光百万海胆!!!

搞笑娱乐笑话 浏览 1584

中国移动成出海“赋能者”,聚星计划覆盖5000+伙伴

雷科技 浏览 2716

每体:腓骨骨折的邦马蒂将接受手术,或将伤缺5个月

懂球帝 浏览 2035

外媒:安世半导体已暂停向中国工厂供应晶圆

澎湃新闻 浏览 13424

超微电脑Q1财季营收大幅下滑15%,毛利率暴跌至9%,盘后股价重挫10%

华尔街见闻官方 浏览 2400

陈道明被王家卫说他是阴阳同体的极品

包饺子ai剪辑 浏览 2469

哈马斯同意“20点计划”提议:释放所有以色列人质

央视新闻客户端 浏览 2857

慢镜头:米兰、尤文和三家英超俱乐部对热苏斯感兴趣

懂球帝 浏览 2548

委内瑞拉空军基地遭美袭击后 导弹碎片四散

极目新闻 浏览 1646

Slack CEO 加盟 OpenAI,担任公司首席营收官

经济观察网 浏览 1972

猜你喜欢拿“嘴替”当情绪解药......

时尚COSMO 浏览 2067

马斯克:特斯拉Optimus机器人将成为“令人难以置信的外科医生”

IT之家 浏览 2569

AI“碰撞”量子 一场颠覆未来的创新变革在这里诞生

上观新闻 浏览 2865

中国人寿前三季归母净利润超1678亿元,高基数基础上同比增60.5%

证券市场周刊 浏览 2524

奇瑞汽车宣布三大升级计划,2026年超35款车型将搭载猎鹰智驾

IT之家 浏览 1619

任泽平发声回应但斌“认错”:理性讨论比对错更重要

财视传播 浏览 1596
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1