360新闻2024年10月11日发布:特斯拉DOJO+英伟达GPU+谷歌TPU+昇腾:趋势是带宽与扩展性!
⭐发布日期:2024年10月11日 | 来源:360新闻
【香港二四六资料大全2022年开奖结果今晚】 |
【澳门正版资料免费更新结果查询】 |
【2024管家婆资料正版大全澳门】 | 【2024噢门天天开好彩大全】 | 【澳门精准三肖三码三期结果最新开奖记录】 | 【新澳2024今晚资料】 | 【ww4949王中王】 | 【澳门一肖一码100%免费公开】 | 【澳门赛马会资料最准一码开奖记录查询】 | 【2024澳门资料免费大全开奖结果记录】 |
【澳门一码一肖100%开奖结果查询】 | 【4949澳门免费大全】 | 【新澳门六开彩资料大全网址】 | 【2024年澳门天天开好大全】 | 【2024年新澳门开码结果】 | 【澳门一肖中100%期期准】 | 【2024澳彩今晚开什么号码开奖历史记录】 | 【澳门王中王论坛资料开奖结果记录】 |
本期投资提示:
特斯拉Dojo 芯片、华为服务器/AI 能力都是近期产业重要事件。本篇报告分析特斯拉Dojo/英伟达 GPU/谷歌TPU/华为昇腾等的异同,并做AI 产业计算和通信趋势的预测。
Dojo 芯片与架构的特色至少包括存算一体/扩展性强/路由便捷/带宽高。在IEEE MICRO2020 上, 特斯拉发布FSD《Compute Solution for Tesla ’ s Full Self-DrivingComputer》。在2022 年8 月hotchips 34 大会上,特斯拉发布《The Microarchitectureof Dojo, Tesla’s Exa-Scale Computer》和《Dojo Super-Compute System Scaling forML Training》。Dojo 至少有存算一体/扩展性强/路由便捷/带宽高四个特色。
英伟达GPU/谷歌TPU/昇腾AI/Tesla DSA,从架构解释异同。1)2010 年以来,英伟达GPU 主要架构至少包括八类,具备衍生关系。趋势:注重互联/注重带宽和扩展性/对AI 支持与时俱进(从Cuda Core 到Tensor Core,增加对INT/BF16 等AI 新趋势的支持,结构稀疏矩阵支持)。2)根据TPU 五代架构,趋势:注重互联/注重扩展性/对AI 支持与时俱进(如用脉动阵列的方法支持矩阵乘法)。3)根据华为官网和《机器之心》等,华为昇腾(达芬奇架构)应与谷歌TPU 有类似之处。4)共同点是扩展性/AI 甚至大模型下特殊操作,区别是Dojo 有特殊性(不同处理器设计是“架构向后兼容”,不需要颠覆架构)。
计算部分的未来趋势:1)与时俱进,适应AI 数据精度/场景特殊运算。2)带宽最大化,延展性关键化。3)核心数可能减少。正文有详细论述。
通信部分:DIP 和TTPoE 是Dojo 的网络核心。Dojo 系统的构架过程,以node 核心为最小单元,每1 个D1 包含354 个nodes、每1 个Tile 包含25 个D1、每1 个Tray 包含6 个Tiles,每个机柜包含2 组Tray。Dojo Interface Processor(DIP)用于HBM内存扩容、PCIe 扩展、以及对外的网络连接。Tesla Transport Protocol 可以对应于CXL、NVLink 等,基于以太网提供400Gb/s 的核心网络带宽。
通信部分的未来趋势:Dojo 试图打破冯诺依曼约束,借助软件与网络,平衡系统中的时延、带宽、资源消耗量和传输距离。我们推算Dojo 的网络设备与器件使用情况,基础BasePOD 177 个机柜的规模下,假设fat-tree 的2 层交换架构组网且全部使用光通信系统,总共需要14160×2=28320 个光模块,对应177 个机柜中的53100 个D1 芯片,另外Host 系统预计也需要若干光模块。若Dojo 系统与Nvidia A100 系统对标,显著差异是网络带宽从200Gb 网络升级至400Gb、SRAM与DRAM容量与带宽提升、引入15kw的液冷封装方案,最终整体算力性能显著提升。
流量环节:关注中际旭创、华工科技、新易盛、天孚通信、中兴通讯、紫光股份、锐捷网络等;计算环节:关注浪潮信息、胜宏科技(电子)、神州数码(tmt)等;华为产业链:
关注华大九天(tmt,EDA)、软通动力(大模型+OS+数据库)、长电科技(电子,封测)、润达医疗 (医疗AI)、赛意信息(MetaERP) 、中软国际、广电运通、神州数码等;特斯拉和智能车产业链:关注德赛西威、立讯精密(电子)、双环传动(机械&汽车)等。
风险:关注由于复工/宏观环境等扰动,2022-2023 年内存在业绩波动风险。GPU/DSA、智联汽车、机器人领域一向的风险依然是研究竞争、产业链地位与管理。若难以相对准确地把握,可能会选中了次好的公司,对投资产生不良的结果【澳门马会7777788888开奖结果】 【番巷二四六正版姿料】 |
【4949澳门资料免费大全高手】 【7777888888管家婆中特】 |
【六开彩澳门结果查询开奖结果查询】 【澳门最准一肖一码一码匠子生活】 |
【澳门最准内部资料u7】 【澳门资料大全】 |
【香港二四六开彩资料大全302期】 【澳门三肖三码期期准精选1是】 |
【2024澳门历史记录开奖记录今晚】 【2024年澳门今晚开码料开奖记录查询】 【新澳门资料大全免费新鼬077开奖结果记录】 |
发表评论
王冠雄
9秒前:2)带宽最大化,延展性关键化。
IP:18.21.3.*
莉莉·索博斯基
7秒前:若Dojo 系统与Nvidia A100 系统对标,显著差异是网络带宽从200Gb 网络升级至400Gb、SRAM与DRAM容量与带宽提升、引入15kw的液冷封装方案,最终整体算力性能显著提升。
IP:33.10.3.*
李庾
6秒前:Dojo 系统的构架过程,以node 核心为最小单元,每1 个D1 包含354 个nodes、每1 个Tile 包含25 个D1、每1 个Tray 包含6 个Tiles,每个机柜包含2 组Tray。
IP:70.80.2.*