自学内容网 自学内容网

特斯拉 DOJO超级计算系统究竟是个啥?(2)

最近把欠读者的连载的坑先填完,再开新坑,除非有特别的事件驱动临时更新新内容以外

      书接前文:特斯拉 DOJO超级计算系统究竟是个啥?(1) (qq.com)

      复习一下上节课的内容

图片

      总结一下Dojo的几个特点:

  • 非分离架构,存算一体:这其实也会是今后的方向,因为你存CKPT越快,你训练速度越快,以后的所有训练架构肯定都不会做存算分离,这是趋势,片内片外都是

  • 每个core都可以扩展到D1或者D2,每个D1或者D2都能扩展到Tile,积木式玩法,大概率是今后自产芯片的趋势,(我司的Maia也是,但是没细粒度到Core级别,后面我会讲)

  • 减少布线:core--->D1--->Tile几乎都是尽可能片内,减少布线,算力堆叠降低延迟

  • 效率最大化,内核就给2Ghz,除了分支预测和小指令的缓存,其他面积全给NPU组件,向量和矩阵计算单元,和Nvidia相比,良心到极致,反正也是自己用

    图片

  • 能省就省:Dojo core没有数据端缓存,没虚拟内存,不支持精确异常处理,说白了Dojo 等于战神GTR,"我不会让你等到弯道,而是在直道就开始加速干翻你!

    图片

    "


原文地址:https://blog.csdn.net/kingsoftcloud/article/details/136045582

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!