Setting, Error/Python, Python Library

[Error] CUDA call failed lazily at initialization with error: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at "../aten/src/ATen/cuda/CUDAContext.cpp":50, please report a bug to PyTorch. device=?, num_gpus=?

Juheon Kwak 2024. 4. 16. 20:55

import os

os.environ['CUDA_VISIBLE_DEVICES'] = '3'

 

이렇게 os로 gpu를 설정하는 것보다 import torch를 더 먼저 실행하여 생기는 문제

 

import torch를 하게 되면 기본적으로 0번 GPU를 torch가 가져온다고 한다.

 

▶os.environ을 먼저 실행하여 torch보다 먼저 GPU 권한을 설정한다. (그냥 무조건 os.environ부터 제일 먼저 실행하기)

 

+ 추가적으로 pytorch 환경변수가 꼬여서 생기는 오류이기도 하다.

맨 처음에 환경변수 해제 명령어를 실행해준다.

 

$ unset LD_LIBRARY_PATH

 

import os

os.environ['CUDA_VISIBLE_DEVICES'] = '3'

 

import torch

torch.cuda.device_count()