RuntimeError: Triton Error [CUDA]: device kernel image is invalid
Bug
backend='inductor' raised:
RuntimeError: Triton Error [CUDA]: device kernel image is invalid
Set TORCH_LOGS="+dynamo" and TORCHDYNAMO_VERBOSE=1 for more information
查了一下是显卡驱动和triton版本不匹配的问题。
出问题的应该都在triton==3.0.0
。
网上有人说降级回到2.1.0
就可以解决了。
出错环境
NVIDIA-SMI 470.199.02 Driver Version: 470.199.02 CUDA Version: 11.8
torch==2.4.1
triton==3.0.0
相关issuse
【1】https://github.com/triton-lang/triton/issues/1556
【2】https://github.com/triton-lang/triton/issues/1955#issuecomment-1929908209
【2】中给了一个可以使用的版本说明
Driver Version: 470.141.03 CUDA Version: 11.4
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=11.8 -c pytorch -c nvidia
版本依赖梳理
pypi
https://pypi.org/project/torch/#history
截止24.11,
torch==2.4.0
的安装依赖于triton==3.0.0
,(通过pypi检查)
triton3.0.0
貌似与driver 470
开头的驱动不匹配,驱动太老了。
一个方法是降torch版本。
torch==2.2.1+cu118
依赖于 triton==2.2.0
。
torch==2.1.2+cu118
依赖于 triton==2.1.0
。
conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install torch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 --index-url https://download.pytorch.org/whl/cu118
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install torch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 --index-url https://download.pytorch.org/whl/cu118
原文地址:https://blog.csdn.net/w55100/article/details/143755971
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!