关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻948人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

倪妮新剧旗袍造型好美 中式穿搭永不过时

她读 浏览 19783

中石油原副总经理徐文荣被查 落马时机引人关注

中国新闻周刊 浏览 88742

意媒:尤文完成备战皇马最后一练,米雷蒂和热格罗瓦回归合练

懂球帝 浏览 843

30多家犬业基地扎推上海西南角 致污水横流良田成荒地

上观新闻 浏览 103872

奥本海默横扫7项奥斯卡大奖,它再现了一个科学家的天真和悲哀

知识分子 浏览 11234

萨哈:桑乔是曼联最失败的引援之一,他觉得自己凌驾于教练之上

直播吧 浏览 12560

美国“福特”号航母驶往加勒比海

上观新闻 浏览 696

罗欣药业聘任前基金经理当董秘,刚抛出8.42亿元定增,加码原料药和创新药

红星资本局 浏览 1009

朱一龙演渣男被问是否参考陈思诚 后者表情太精彩

盖饭娱乐官方号 浏览 15540

极氪 001 汽车官宣降价 3 万-3.7 万元,送 7kW 智能家充套餐

IT之家 浏览 14199

乌记者询问中方是否计划向乌克兰提供援助 外交部回应

上观新闻 浏览 91813

拒15亿,Andrew Tulloch重返Meta,Thinking Machines Lab痛失联创

机器之心Pro 浏览 997

普里戈任抵达白俄 北约秘书长称已准备好防御威胁

新京报外事儿 浏览 15867

记者:巴黎仍对和梅西完成续约保持乐观,但目前没有达成协议

直播吧 浏览 19161

日本自卫队战机与美战略轰炸机实施联合训练

财联社 浏览 12292

陈赫首次晒大女儿正脸照,长相酷似张子萱

趣看热点 浏览 26075

秋瓷炫《浪姐》舞台鲨疯了!

她读 浏览 16748

张学友被曝因病进ICU,8个月演100次太辛苦,曝罗美薇4年亏20亿

缘木不求娱 浏览 12409

卡德罗夫再谈"瓦格纳事件":批普里戈任"傲慢自大"

环球网资讯 浏览 15773

里弗斯:有些晚上你必须得赢球 今晚就是其中之一

直播吧 浏览 19367

邓莎每个月生活费曝光,路行一个字都没有说错

贵州小娟 浏览 856
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1