研报下载就选股票报告网
您好,欢迎来到股票分析报告网!登录   忘记密码   注册
>> 申万宏源-计算机行业智联汽车深度三十三暨华为系列深度之六-特斯拉Dojo+英伟达GPU+谷歌TPU+昇腾:趋势是带宽与扩展性!-230918
上传日期:   2023/9/18 大小:   2211KB
格式:   pdf  共29页 来源:   申万宏源
评级:   强于大市 作者:   刘洋,李国盛,杨海晏
行业名称:   汽车
下载权限:   此报告为加密报告
本期投资提示:
  特斯拉Dojo芯片、华为服务器/AI能力都是近期产业重要事件。本篇报告分析特斯拉Dojo/英伟达GPU/谷歌TPU/华为昇腾等的异同,并做AI产业计算和通信趋势的预测。
  Dojo芯片与架构的特色至少包括存算一体/扩展性强/路由便捷/带宽高。在IEEEMICRO2020上,特斯拉发布FSD《 Compute Solution for Tesla ’s Full Self-DrivingComputer》。在2022年8月hotchips 34大会上,特斯拉发布《The Microarchitectureof Dojo, Tesla’s Exa-Scale Computer》和《Dojo Super-Compute System Scaling forMLTraining》。Dojo至少有存算一体/扩展性强/路由便捷/带宽高四个特色,详见正文。
  英伟达GPU/谷歌TPU/昇腾AI/Tesla DSA,从架构解释异同。1)2010年以来,英伟达GPU主要架构至少包括八类,具备衍生关系。趋势:注重互联/注重带宽和扩展性/对AI支持与时俱进(从Cuda Core到Tensor Core,增加对INT/BF16等AI新趋势的支持,结构稀疏矩阵支持)。2)根据TPU五代架构,趋势:注重互联/注重扩展性/对AI支持与时俱进(如用脉动阵列的方法支持矩阵乘法)。3)根据华为官网和《机器之心》等,华为昇腾(达芬奇架构)应与谷歌TPU有类似之处。4)共同点是扩展性/AI甚至大模型下特殊操作,区别是Dojo有特殊性(不同处理器设计是“架构向后兼容”,不需要颠覆架构)。
  计算部分的未来趋势:1)与时俱进,适应AI数据精度/场景特殊运算。2)带宽最大化,延展性关键化。3)核心数可能减少。正文有详细论述。
  通信部分:DIP和TTPoE是Dojo的网络核心。Dojo系统的构架过程,以node核心为最小单元,每1个D1包含354个nodes、每1个Tile包含25个D1、每1个Tray包含6个Tiles,每个机柜包含2组Tray。Dojo Interface Processor(DIP)用于HBM内存扩容、PCIe扩展、以及对外的网络连接。Tesla Transport Protocol可以对应于CXL、NVLink等,基于以太网提供400Gb/s的核心网络带宽。
  通信部分的未来趋势:Dojo试图打破冯诺依曼约束,借助软件与网络,平衡系统中的时延、带宽、资源消耗量和传输距离。我们推算Dojo的网络设备与器件使用情况,基础BasePOD 177个机柜的规模下,假设fat-tree的2层交换架构组网且全部使用光通信系统,总共需要14160×2=28320个光模块,对应177个机柜中的53100个D1芯片,另外Host系统预计也需要若干光模块。若Dojo系统与Nvidia A100系统对标,显著差异是网络带宽从200Gb网络升级至400Gb、SRAM与DRAM容量与带宽提升、引入15kw的液冷封装方案,最终整体算力性能显著提升。
  流量环节:关注中际旭创、华工科技、新易盛、天孚通信、中兴通讯、紫光股份、锐捷网络等;计算环节:关注浪潮信息、胜宏科技(电子)、神州数码(tmt)等;华为产业链:关注华大九天(tmt,EDA)、软通动力(大模型+OS+数据库)、长电科技(电子,封测)、润达医疗(医疗AI)、赛意信息(MetaERP)、中软国际、广电运通、神州数码等;特斯拉和智能车产业链:关注德赛西威、立讯精密(电子)、双环传动(机械&汽车)等。
  风险:关注由于复工/宏观环境等扰动,2022-2023年内存在业绩波动风险。GPU/DSA、智联汽车、机器人领域一向的风险依然是研究竞争、产业链地位与管理。若难以相对准确地把握,可能会选中了次好的公司,对投资产生不良的结果。
 
Copyright © 2005 - 2021 Nxny.com All Rights Reserved 备案号:蜀ICP备15031742号-1