nvidia本地环境部署以及jetson交叉编译环境部署

🕗 发布于 2024-11-11 06:58 nvidia jetson cross compile onnxruntime

本文旨在处理本地电脑nvidia环境部署，以及nvidia orin jenson交叉编译的环境部署。

1. 部署电脑环境

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

CUDA Version	Driver Version
CUDA 12.x	>=525.60.13
CUDA 11.8.x CUDA 11.7.x CUDA 11.6.x CUDA 11.5.x CUDA 11.4.x CUDA 11.3.x CUDA 11.2.x CUDA 11.1.x	>=450.80.02

cuda版本下载
https://developer.nvidia.com/cuda-12-6-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=runfile_local)

cudnn下载
https://developer.nvidia.com/cudnn-9-5-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=deb_local

cudnn版本
https://docs.nvidia.com/deeplearning/cudnn/v9.5.1/release-notes.html

onnxruntime依赖
https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html

电脑部署版本

python	pytorch	CUDA	cuDNN	onnxruntime-gpu
py38+	2.1.0	12.6	9.5.1	1.19.2

2. 部署交叉编译环境

2.1 安装交叉编译环境

1. uname 命令可以显示操作系统和内核的相关信息，这在某些情况下也包含了板子的架构信息
(myenv) qwer@qwer-Z790-EAGLE-AX:/mnt/data/docker_images$ uname -a
Linux qwer-Z790-EAGLE-AX 5.15.0-124-generic #134~20.04.1-Ubuntu SMP Tue Oct 1 15:27:33 UTC 2024 x86_64 x86_64 x86_64 GNU/Linux
2. cat /proc/device-tree  # Jetson 板子的结果类似 NVIDIA Jetson Nano Developer Kit
3. lsb_release -a # 该命令显示操作系统的版本信息
4. 对于 NVIDIA Jetson 板子，可以使用以下命令查看详细的 Jetson 版本信息
    head -n 1 /etc/nv_tegra_release  # 详细的 Jetson 版本信息 R32 (release), REVISION: 4.4
5. dmesg | grep -i board
6. cat /proc/cpuinfo

安装交叉编译环境

sudo apt-get install g+±aarch64-linux-gnu

# 选择合适版本的cuda交叉编译镜像
https://catalog.ngc.nvidia.com/orgs/nvidia/containers/l4t-cuda/tags

# 创建docker环境
docker run -it \
    --runtime=nvidia \
    --privileged \
    --network host \
    --gpus all \
    -e DISPLAY=$DISPLAY \
    -e LIBGL_ALWAYS_SOFTWARE=0 \
    -e LIBGL_ALWAYS_INDIRECT=1 \
    -e NVIDIA_VISIBLE_DEVICES=all \
    -e NVIDIA_DRIVER_CAPABILITIES=all \
    -v /tmp/.X11-unix:/tmp/.X11-unix \
    --device=/dev/bus/usb:/dev/bus/usb \
    --device=/dev/input/js0:/dev/input/js0 \
    -v /mnt/data:/mnt/data \
    --name cross_compiler_12_2_arm64 nvcr.io/nvidia/l4t-cuda:12.2.2-devel-arm64-ubuntu22.04 

# 安装cudnn
https://developer.nvidia.com/cudnn-9-5-1-download-archive?target_os=Linux&target_arch=aarch64-jetson&Compilation=Native&Distribution=Ubuntu&target_version=22.04&target_type=deb_local

2.2 编译onnxruntime

cd onnxruntime

python tools/ci_build/build.py --config Release --use_cuda --build_shared_lib --enable_pybind \
--parallel --skip_tests --build_dir ./build --cuda_home ${CUDA_HOME} \
--cudnn_home ${CUDNN_HOME}
# config Release：指定构建为发布版本。
# use_cuda：启用 CUDA 支持。
# build_shared_lib：构建共享库（onnxruntime 库）。
# enable_pybind：启用 Python 绑定。
# skip_tests：跳过测试（如果你不需要运行测试）。
# 构建 .whl 文件：
# 构建过程完成后，生成 .whl 文件。你可以通过 setup.py 来完成打包：
python setup.py bdist_wheel

编译遇到报错

CMake Error at onnxruntime_providers_cuda.cmake:200 (target_link_libraries):
  Target "onnxruntime_providers_cuda" links to:
    CUDA::cublasLt

修改文件 onnxruntime/cmake/external/onnxruntime_providers_cuda.cmake

###start
set(CUDA_LIB_DIR "/usr/local/cuda-12.2/targets/sbsa-linux/lib")
# 检查是否能找到 CUDA::cublasLt，如果找不到则手动添加路径
if (NOT TARGET CUDA::cublasLt)
    add_library(CUDA::cublasLt SHARED IMPORTED)
    set_target_properties(CUDA::cublasLt PROPERTIES IMPORTED_LOCATION "${CUDA_LIB_DIR}/libcublasLt.so")
endif()

# 检查其他 CUDA 库
if (NOT TARGET CUDA::cublas)
    add_library(CUDA::cublas SHARED IMPORTED)
    set_target_properties(CUDA::cublas PROPERTIES IMPORTED_LOCATION "${CUDA_LIB_DIR}/libcublas.so")
endif()

if (NOT TARGET CUDA::cudart)
    add_library(CUDA::cudart SHARED IMPORTED)
    set_target_properties(CUDA::cudart PROPERTIES IMPORTED_LOCATION "${CUDA_LIB_DIR}/libcudart.so")
endif()

if (NOT TARGET CUDA::curand)
    add_library(CUDA::curand SHARED IMPORTED)
    set_target_properties(CUDA::curand PROPERTIES IMPORTED_LOCATION "${CUDA_LIB_DIR}/libcurand.so")
endif()

if (NOT TARGET CUDA::cufft)
    add_library(CUDA::cufft SHARED IMPORTED)
    set_target_properties(CUDA::cufft PROPERTIES IMPORTED_LOCATION "${CUDA_LIB_DIR}/libcufft.so")
endif()

# 链接库
target_link_libraries(${target} PRIVATE CUDA::cublasLt CUDA::cublas cudnn CUDA::curand CUDA::cufft CUDA::cudart
    ${ABSEIL_LIBS} ${ONNXRUNTIME_PROVIDERS_SHARED} Boost::mp11 safeint_interface)

原文地址：https://blog.csdn.net/weixin_39540045/article/details/143658378

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：计算机网络前三章计算题总结
下一篇：linux tigerVNC使用

2024年Postman 下载安装的详细图文教程
Postman 下载安装的详细图文教程，一看就懂！
阅读更多2024-11-13
ensp中配置ISIS以及ISIS不同区域的通信
ensp中配置ISIS以及ISIS不同区域的通信
阅读更多2024-11-13
Java中的不可变集合：性能与安全并重的最佳实践
不可变集合（Immutable Collections）是一种在创建之后无法被修改的集合。具体来说，一旦不可变集合被创建，你就不能往集合中添加、删除或修改元素。任何对其进行改变的尝试都会导致。不可变集
阅读更多2024-11-13
Day09 C++ 存储类
这些说明符放置在它们所修饰的类型之前。
阅读更多2024-11-13
Processing Modflow软件安装，建立地下水-地面沉降数值模型的流程与步骤（构造沉降、抽水沉降、采空沉降等）；三维地质建模数据处理
针对地面沉数值模拟技术，结合不同行业的需求，详细讲解利用Processing Modflow软件建立地下水-地面沉降数值模型的流程与步骤，同时，选取真实案例，运用模拟技术解析铁路沿线地面沉降的预测，优
阅读更多2024-11-13
封装一个获取汉字拼音的小工具，获取汉字拼音、首字母、多个汉字的首字母
封装一个获取汉字拼音的小工具，获取汉字拼音、首字母、多个汉字的首字母
阅读更多2024-11-13
双十二有哪些好物是值得入手的？2024年双十二最全选购清单总结
这款本子是2024年的新品，性能很强，搭载了M2芯片，流畅度是很高的，玩游戏、学习、工作都没有任何问题。摄像也很强，前后均为1200万像素的主摄，支持人物居中、4K视频录制等，拍照非常的有质感，很丝滑
阅读更多2024-11-13
Python | Leetcode Python题解之第557题反转字符串中的单词III
Python | Leetcode Python题解之第557题反转字符串中的单词III
阅读更多2024-11-13
swiper vue-awesome-swiper基本使用以及注意事项
下载插件（最新版本的swiper可能会出现未知bug，所以这里使用5.4.5）安装swiper和vue-awesome-swiper一定要对应上版本，否则引入，或者语法会出报错，每一个swiper版本
阅读更多2024-11-13
低代码集成多方API的简单实现
在现代软件开发中，集成多个API服务提供商已成为常见需求。然而，不同的API认证机制和数据格式使得集成过程变得复杂且耗时。为了应对这些挑战，本文将介绍一种低代码解决方案，通过配置化管理和简化的代码逻辑
阅读更多2024-11-13