自学内容网 自学内容网

RuntimeError: Triton Error [CUDA]: device kernel image is invalid

Bug

backend='inductor' raised:
RuntimeError: Triton Error [CUDA]: device kernel image is invalid

Set TORCH_LOGS="+dynamo" and TORCHDYNAMO_VERBOSE=1 for more information

查了一下是显卡驱动和triton版本不匹配的问题。
出问题的应该都在triton==3.0.0
网上有人说降级回到2.1.0就可以解决了。

出错环境

NVIDIA-SMI 470.199.02   Driver Version: 470.199.02   CUDA Version: 11.8
torch==2.4.1
triton==3.0.0

相关issuse

【1】https://github.com/triton-lang/triton/issues/1556
【2】https://github.com/triton-lang/triton/issues/1955#issuecomment-1929908209

【2】中给了一个可以使用的版本说明

Driver Version: 470.141.03 CUDA Version: 11.4
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=11.8 -c pytorch -c nvidia

版本依赖梳理

pypi

https://pypi.org/project/torch/#history

截止24.11,
torch==2.4.0的安装依赖于triton==3.0.0,(通过pypi检查)
triton3.0.0貌似与driver 470开头的驱动不匹配,驱动太老了。

一个方法是降torch版本。
torch==2.2.1+cu118 依赖于 triton==2.2.0
torch==2.1.2+cu118 依赖于 triton==2.1.0

conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install torch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 --index-url https://download.pytorch.org/whl/cu118
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install torch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 --index-url https://download.pytorch.org/whl/cu118

原文地址:https://blog.csdn.net/w55100/article/details/143755971

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!