研报下载就选股票报告网
您好,欢迎来到股票分析报告网!登录   忘记密码   注册
>> 中原证券-计算机行业分析报告:DeepSeek近期成果分析及V4影响力预测-260129
上传日期:   2026/1/29 大小:   1472KB
格式:   pdf  共11页 来源:   中原证券
评级:   强于大市 作者:   唐月
行业名称:   计算机
下载权限:   无限制-登录即可下载
投资要点:
   The Information报道,DeepSeek将在2026年2月中旬推出新一代旗舰AI模型DeepSeek V4,V4编码能力超越Claude和GPT系列。我们认为V4对标预期中在2025年5月发布的R2模型。
   2026年1月12日,DeepSeek论文聚焦分配的稀疏化方案,引入了名为“Engram”的条件记忆模块,明显改善了模型性能,成为MOE的重要补充。同时通过对计算与内存的解耦,缓解了当前GPU内存受限的困境,有望大幅缓解国产AI芯片厂商HBM被卡脖子的境况。
   2026年1月1日,DeepSeek论文提出了名为mHC的新网络架构,解决信息的流动。mHC架构是建立在此前字节发布的HC基础上,重点改进了ResNet架构信息通道宽度受限、增加的计算冗余和内存占用的问题。在MoE模型上,mHC使得模型训练的收敛速度提升了约1.8倍。
   DeepSeek在模型DeepSeek-OCR和DeepSeek-OCR2中,将视觉作为文本压缩媒介的新方法,将文本以图片的方式进行输入,可以极大减少输入所需要的token数量,解决长文本输入问题。
   2026年1月4日,DeepSeek更新了R1论文,从22页增加到了86页,让业界对V4的发布充满了更多的期待。根据论文的成本数据,R1的总训练成本为586万美元,远低于顶级模型训练动辄千万美元的门槛,其中预训练和后训练分别占总成本的95%和5%。
  结合DeepSeek当前的研究成果,我们给出V4潜在的创新方向的猜想和影响力预测:
  (1)模型成本的降低,有望较大缓解地目前国内缺芯的状况。
  (2)继续开源路线,同时模型能力超越闭源模型。有望深刻改变海外AI产业的发展格局,利好AI应用的落地。
  (3)基于独立于transformer的全新架构。这意味着V4将带来里程碑意义的技术突破,开启大模型发展的新范式,帮助人类更快地通往AGI。
  (4)与国产芯片进一步的深度融合,可能部分或全部采用国产芯片进行训练利好国产算力的生态建设,。
  风险提示:国际局势的不确定性;海外AI产业竞争格局变化带来市场调整风险。
 
Copyright © 2005 - 2021 Nxny.com All Rights Reserved 备案号:蜀ICP备15031742号-1