自学内容网 自学内容网

显卡 3090 vs v100

1.3090

  • Date: 2020 Ampere
  • Pielines/ Cuda cores: 10496

2.V100

  • Date: 2018 Volta
  • Pielines/ Cuda cores: 5129

3.结构 & Core比较:

  • v100优点:

    • v100功耗小
    • v100较快的双精度(fp64)和混合精度(fp16+fp32)
    • pcie版的NVLink与2080ti完全一致
  • v100缺点:

    • 不支持整数格式计算,即INT4、INT8, 即无量化推理能力, 除非上turing架构
    • 不支持半精度的bf16, 只支持fp16 (bf: Google brain floating point format, 可加快训练速度)
    • 不支持单精度fp32
    • 不支持awq量化、支持gptq量化
    • 不支持flash-attention、支持vllm

4. 理论性能(Theoretial Performance)

- 3090 vs. A100NVIDIA RTX 3090    NVIDIA A100 40 GB (PCIe)     Difference
- FP16 (half) performance    35.58 TFLOPS    77.97 TFLOPS     42.39 TFLOPS (119%)
- FP32 (float) performance    35.58 TFLOPS    19.49 TFLOPS     16.09 TFLOPS (-45%)
- FP64 (double) performance    556 GFLOPS    9746 GFLOPS      9190 GFLOPS (1653%)
- Pixel Rate    189.8 GPixel/s    225.6 GPixel/s     35.8 GPixel/s (19%)
- Texture Rate    556 GTexel/s    609.1 GTexel/s     53.1 GTexel/s (10%)
  • 多类N卡比较
    在这里插入图片描述

4.性能详细对比

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Reference

  • https://technical.city/en/video/GeForce-RTX-3090-vs-Tesla-V100-PCIe-32-GB
  • https://zhuanlan.zhihu.com/p/667255235
  • https://bizon-tech.com/gpu-benchmarks/NVIDIA-RTX-3090-vs-NVIDIA-A100-40-GB-(PCIe)/579vs592
  • https://www.bilibili.com/read/cv33373992/?from=readlist

原文地址:https://blog.csdn.net/disanda/article/details/142799145

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!