win10 安装TensorRT

🕗 发布于 2024-11-14 01:30 深度学习 人工智能

1,下载TensorRT 安装包

进入英伟达官网Log in | NVIDIA Developer，选择和自己适配的TensorRT,我选择的是 TensorRT-8.6.1.6.Windows10.x86_64.cuda-11.8

注意：EA是提前发布的不稳定版本,GA是经过完备测试的稳定版

2，安装：

解压安装包后得到如下所示图：

安装TensorRT文件夹中即的.whl文件*


cd TensorRT-8.6.1.6

# 激活conda环境, 或者本机的Python环境
pip install .\graphsurgeon\graphsurgeon-0.4.6-py2.py3-none-any.whl
pip install .\onnx_graphsurgeon\onnx_graphsurgeon-0.3.12-py2.py3-none-any.whl

# 此行根据自己的Python版本选择！！！
pip install .\python\tensorrt-8.6.0-cp38-none-win_amd64.whl

pip install .\uff\uff-0.6.9-py2.py3-none-any.whl

即

C:\Program Files\wk\TensorRT-8.6.1.6.Windows10.x86_64.cuda-11.8\TensorRT-8.6.1.6\python
下的.whl文件


pip install tensorrt-8.6.1-cp38-none-win_amd64.whl

安装完成相应的库以后，需要注意将TensorRT-8.6.1.6文件夹下的lib\include中的文件进行如下拷贝工作，防止在运行tensorrt时候无法找到相对应的Nvinfer.dll

TensorRT-8.6.1.6中include文件夹下所有文件拷贝到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\include

TensorRT-8.6.1.6中lib文件夹下所有lib文件拷贝到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\lib\x64

TensorRT-8.6.1.6中lib文件夹下所有dll文件拷贝到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\bin

把tensorRT，TensorRT-8.6.1.6文件下面的bin、include、lib添加到环境变量：

4，验证TensorRT是否安装成功

查看trt的版本

import tensorrt as trt

print(trt.__version__)

运行

进入C:\Program Files\wk\TensorRT-8.6.1.6\samples\python\network_api_pytorch_mnist
运行
python sample.py

如果报错：

  File "C:\Program Files\wk\TensorRT-8.6.1.6\samples\python\network_api_pytorch_mnist\..\common.py", line 25, in <module>
    from cuda import cuda, cudart
ModuleNotFoundError: No module named 'cuda'

pip install cuda-python

如下所示表示成功

至此，windows安装TensorRT的过程就结束了。

5，测试

使用vs2019打开 sample_onnx_mnist.sln 工程，如果所示：

然后右键sample_mnist项目，右键选择属性。然后再属性页选择“VC++目录——可执行文件目录”，打开“可执行文件目录”，将“C:\Program Files\wk\TensorRT-8.6.1.6\lib”添加进去，然后点击“确定”。

选择“C/C++——附加包含目录，点进去添加“C:\Program Files\wk\TensorRT-8.6.1.6\bin”，然后点击“确定”。

右键“sample_mnist”工程，然后选择“重新生成”。看到如下信息，则表明生成成功。

注意事项
（1）TensorRT是硬件相关的
不同显卡(不同GPU)，其核心数量、频率、架构、设计都是不一样的，TensorRT需要对特定的硬件进行优化，不同硬件之间的优化是不能共享的。

（2）TensorRT支持哪几种权重精度
支持FP32、FP16、INT8、TF32等，这几种类型都比较常用。

FP32：单精度浮点型，深度学习中最常见的数据格式，训练推理都会用到；
FP16：半精度浮点型，相比FP32占用内存减少一半，有相应的指令值，速度比FP32要快很多；
TF32：第三代Tensor Core支持的一种数据类型，是一种截短的 Float32 数据格式，将FP32中23个尾数位截短为10bits，而指数位仍为8bits，总长度为19(=1+8 +10)。保持了与FP16同样的精度(尾数位都是 10 位），同时还保持了FP32的动态范围指数位都是8位)；
INT8：整型，相比FP16占用内存减小一半，有相应的指令集，模型量化后可以利用INT8进行加速。

原文地址：https://blog.csdn.net/zhaoluruoyan89/article/details/143718797

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：简单介绍 Spring 中获取 Bean 的三种方式
下一篇：11.6-11.7重大专业能力测试（换皮c++考试）全攻略（两天速通版）

「QT」文件类之 QTemporaryDir 临时目录类
QTemporaryDir类是Qt框架中用于创建和管理临时目录的类。它提供了一个便捷且安全的方式来生成唯一的临时目录，这些目录通常用于存储临时文件或子目录，以便在程序运行期间进行临时存储或处理。QTe
阅读更多2024-11-16
【c++笔试强训】（第五篇）
因此，Fibonacci数列就形如：0, 1, 1, 2, 3, 5, 8, 13, ...，在Fibonacci数列中的数我们称为Fibonacci数。给你一个N，你想让其变为一个Fibonacci
阅读更多2024-11-16
vue2 动态路由的实现
一般情况下，路由都是前端约定好的，但是每当项目发布上线，或者客户需求新的页面的时候，都需要做出路由改变。这样运维就可以现场支持，方便做出可操作的中户中台，来管理我们的中心项目登录及权限，路由等方面；注
阅读更多2024-11-16
算法导论第二章
从今天开始会陆续更新关于算法导论的啃书相关文章，先从前往后而且比较常用的章节开始讲起，所以可能会有部分不怎么用的着的章节会跳过。由于第一章没讲什么具体内容，所以选择跳过从第二章开始讲起。
阅读更多2024-11-16
生成式GPT商品推荐：精准满足用户需求
随着人工智能（AI）技术的飞速发展，电商平台正在逐步迎来一场前所未有的变革。尤其是生成式GPT（Generative Pre-trained Transformer）技术的应用，正在重新定义电商平台如
阅读更多2024-11-16
【机器学习基础】西瓜书阅读笔记task01
机器学习：研究如何通过计算的手段，利用经验来改善系统自身的性能计算机系统中，经验通常以数据形式存在。机器学习研究的主要内容：计算机从数据中产生模型的算法，即“学习算法”把经验（经验数据）提供给这个算法
阅读更多2024-11-16
卷积神经网络之Yolo详解
IoU用于衡量预测框与真实框的重叠程度，是目标检测中的基础评估指标。置信度反映了模型对于其预测框包含物体的信心。精确率衡量了预测为目标的框中，实际是目标的比例。召回率衡量了模型能够找到的真实目标的比例
阅读更多2024-11-16
ssm092基于Tomcat技术的车库智能管理平台+jsp(论文+源码)_kaic
它将程序数据通过使用不同的数据表格进行保存，在增加了程序数据的存储速度的时候，也提高了数据库的灵活性。当前需要开发的程序软件是根据当下的用户需求进行设计开发的，但是随着时间的推移，社会大环境的改变，开
阅读更多2024-11-16
vue3初始项目结构与分析
时隔多年再次学习vue，单纯学习刚创立好的项目分析其结构与运作方式，掌握了基础才能在工作中延申。
阅读更多2024-11-16
理解 C++ 中的 `const` 关键字
const关键字在 C++ 中的使用是良好的编程实践。它能提高代码的安全性、可读性，并帮助优化编译器的性能。为了防止逻辑错误和性能问题，建议在可能的情况下尽量使用const。通过对比其他编程语言，可以
阅读更多2024-11-16

win10 安装TensorRT

相关文章