关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻974人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杜兰特错失关键跳投,篮网两连胜被终结

趣看热点 浏览 25893

比亚迪:仰望U8豪华版预计8月正式上市,9月开启陆续交付

界面新闻 浏览 15626

国产、进口全线降!特斯拉3天2次降价暴击电动车市场

封面新闻 浏览 14605

你的前三是?记者评史最佳中场:魔笛第1,齐祖第2,马特乌斯第3

直播吧 浏览 15311

山姆变盒马?500万中产抵制“阿里味”

花朵财经 浏览 682

媒体:指控字节跳动的前员工 或已与美情报部门合作

环球时报国际 浏览 16088

真的强!库里末节7投7中 追平生涯末节百分百命中纪录!

直播吧 浏览 13217

霍建华自曝婚姻真相!网友:林心如彻底不管他了……

GirlDaily 浏览 10878

乔-科尔:波特根本就没得到足够的支持,西汉姆对他有所怀疑

懂球帝 浏览 1509

《疯狂动物城2》之后,更炸的大片来了

独立鱼 浏览 313

四个男顶流火了之后怎么变丑了?

想刊刊 浏览 13188

特朗普:内塔尼亚胡执政前景“存在不确定性”

环球网资讯 浏览 1070

俄总统特别代表:已向美方通报“海燕”核动力导弹试射情况

极目新闻 浏览 851

集微咨询发布《2025中国电源管理芯片行业上市公司研究报告》

爱集微 浏览 10

“富贵闲人”许绍雄的快乐哲学

仙女事件簿 浏览 878

官方:勇士正式签下塞斯-库里,后者将身披31号球衣

懂球帝 浏览 293

安徽蚌埠办音乐节在桥上建围挡引质疑 几天后又拆除

环球网资讯 浏览 89071

支付宝旗下两家经营主体完成更名,支付宝APP名字不变

澎湃新闻 浏览 1678

贝尔巴托夫:我希望鲁尼攀登教练之路,未来他想执教曼联

直播吧 浏览 12890

小牛队球星卢卡·东契奇因颈椎劳损,被列为第4场对阵快船队的比赛出战成疑

趣看热点 浏览 26187

没上映票房就破2400万,邓超加陈凯歌都压不住,国庆档冠军定了?

靠谱电影君 浏览 1533
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1