>> 中邮证券-计算机行业点评报告:技术与资本共振,国产大模型护航AI应用浪潮-260105
| 上传日期: |
2026/1/5 |
大小: |
548KB |
| 格式: |
pdf 共4页 |
来源: |
中邮证券 |
| 评级: |
强于大市 |
作者: |
陈涵泊,李佩京,王思 |
| 行业名称: |
计算机 |
| 下载权限: |
无限制-登录即可下载 |
|
|
DS新年开源mHC新架构,破解了大模型训练稳定性难题 2026年1月1日,DeepSeek发布题为《mHC:Manifold-ConstrainedHyper-Connections》的学术论文,该论文由DeepSeek创始人兼CEO梁文锋参与署名。论文提出的mHC(流形约束超连接)新网络架构,直指当前大模型训练中以超连接(HC)为代表的技术方案带来的三大痛点:大模型训练中存在的稳定性差、可扩展性受限及内存开销大,制约大模型工业化落地进程。针对上述痛点,mHC架构构建了兼顾性能与效率的改进框架:一方面将HC的残差连接空间投影至特定流形,精准恢复身份映射特性,解决训练不稳定问题;另一方面通过严谨的基础设施优化,降低内存开销并提升运行效率。实证表明,mHC在大规模训练中(如27B模型)表现出卓越的可扩展性。在n=4的扩展倍率下,仅增加了6.7%的训练时间开销,却换来了显著的性能提升。 我们认为,mHC通过优化神经网络连接架构,在提升性能的同时显著降低了大规模AI模型的训练门槛与成本,推动行业竞争从参数规模转向效率与稳定性,提供大模型创新新范式。 国产大模型资本化进程加速,产业基础持续巩固 智谱与MiniMax冲刺港股IPO,Kimi完成新一轮融资。2025年12月中旬,智谱和MiniMax先后在港交所披露招股书;30日,智谱开起招股,预计2026年1月5日结束,并计划于2026年1月8日正式以“2513”为股票代码在港交所主板挂牌上市,冲刺“全球大模型第一股”。2025年12月31日,《晚点LatePost》独家获悉,月之暗面(Kimi)近期完成5亿美元C轮融资,IDG领投1.5亿美元,阿里、腾讯、王慧文等老股东超额认购,投后估值43亿美元。我们认为,智谱、Minimax等头部公司的上市进展,不仅为行业注入了充裕资金,也标志着资本市场对AI大模型商业化前景的认可度显著提升。例如,Kimi C端9-11月,海外和国内付费用户数平均MoM增长超过170%。同时,K2 Thinking的发布也显著带动了API收入的增加,9-11月海外API收入增长4倍。 应用生态蓬勃发展,Manus打通优质AI创业公司退出路径 在应用端,千问、灵光、阿福等面向垂直场景的大模型产品正加速落地,有望在金融、教育、办公等多领域加速渗透。QuestMobile显示,在2025年12月8日至14日期间,蚂蚁阿福与灵光表现亮眼,周活跃用户规模分别突破千万和三百万量级,成功跻身同期新应用榜单前两位。同时,以Manus被高价收购为代表的事件,反映出市场对优质AI应用标的的强烈需求,这不仅为创业团队提供了明确的退出路径,也显著降低了AI应用的创新试错成本,将进一步激发应用层创新活力。 投资建议 我们认为,我国大模型产业已从技术追赶迈入系统化布局与生态构建的新阶段,在算法突破、算力协同、数据积累、资本助力及政策支持的共同推动下,国产大模型有望在2026年前后实现从“并跑”到部分领域“领跑”的跨越,在全球AI竞争中占据关键地位。建议关注: 1)港股互联网:阿里巴巴、腾讯控股、网易、快手、小米集团、京东集团、腾讯音乐、金蝶国际、迈富时、百度集团、商汤、金山云、金山软件、哔哩哔哩、美图公司、中国软件国际、浪潮数字企业; 2)Agent:金山办公、鼎捷数智、视源股份、蓝色光标、泛微网络、致远互联、普元信息、用友网络、汉得信息、赛意信息、合合信息、福昕软件、税友股份、润达医疗、同花顺、恒生电子、万兴科技、科大讯飞、金桥信息; 3)国内算力:寒武纪、海光信息、摩尔线程、沐曦股份、云天励飞、浪潮信息、曙光数创、亿都(国际控股)、超讯通信、瑞晟智能、华丰科技、神州数码、软通动力、烽火通信、拓维信息、四川长虹、润建股份、数据港、润泽科技、光环新网、科华数据、奥飞数据、优刻得、卡莱特、安博通; 4)海外算力:新易盛、中际旭创、天孚通信、东山精密、长光华芯、腾景科技、福晶科技、长芯博创、源杰科技、华工科技、光迅科技、太辰光、仕佳光子、胜宏科技、景旺电子、沪电股份、生益电子、深南电路、兴森科技、工业富联、英维克、高澜股份、申菱环境、巨化股份、川环科技、同飞股份、飞荣达、鸿腾精密、麦格米特、欧陆通、禾望电器、盛弘股份、杰华特、紫光股份、锐捷网络、中兴通讯、菲菱科思等。 风险提示: 技术迭代不及预期、国内AIAgent商业化进展不及预期、算力供应不及预期、行业竞争加剧风险等。
|
|