Setting, Error/GPU 7

[Error] Could not load dynamic library 'cudart64_110.dll' dlerror cudart64_110.dll not found

※ rtx 3090, ubuntu 20.04, docker, tensorflow 사용 맨 처음 tensorflow-gpu의 버전부터 바꿔보기, 2.4를 사용하면 똑바로 gpu가 인식되는 경우가 있다. $ pip3 install tensorflow-gpu==2.4.0 해당 에러로 도커 내부의 tensorflow에서 gpu가 잡히지 않는다. 필요로 하는 것은 11 버전인데 cudnn을 깔면 8이나 10으로 설치되었기 때문이다. 뒤에 나와있는 숫자를 다 11로 바꿔주면 된다. ※ 이미 cudnn이 다 깔려있다면 3번으로 가서 숫자만 바꾸면 된다. [해결방법] 1. nvidia 홈페이지(밑의 링크)에 가서, 로그인 후 cudnn을 본인의 환경에 맞게 다운로드 후 압축 해제 https://developer.nvi..

Setting, Error/GPU 2022.04.01

[nvtop] GPU 사용량 확인

※ Window의 작업관리자, ubuntu의 htop처럼 GPU의 사용량을 확인하게 해주는 nvtop 사용법. ※ 사용환경 : Ubuntu LTS 20 - nvtop 설치 $ sudo apt install nvtop sudo가 없을 경우 $ apt-get install -y sudo 먼저 하고 nvtop 설치 - 설치 및 동작 확인 $ nvtop - apt로 nvtop이 깔리지 않을 때 $ sudo apt install cmake libncurses5-dev libncursesw5-dev git $ git clone https://github.com/Syllo/nvtop.git GitHub - Syllo/nvtop: AMD and NVIDIA GPUs htop like monitoring tool AMD..

Setting, Error/GPU 2021.08.09

[Install] GPU 환경세팅 (CUDA)

※ GPU를 사용하기 위한 cuda 및 GPU 드라이버 설치 ※ 사용환경 : Ubuntu LTS 20, RTX 3090 0. 사용환경 update $ sudo apt update 더보기 Error : sudo command not found 가 뜬다면 $ apt-get install -y sudo 1. nvidia-driver 설치 $ sudo apt search nvidia-driver 더보기 해당 apt 버전에 맞는 nvidia 드라이버 버전을 보여준다. 나오는 드라이버 중 원하는 것을 설치하면 되는데, 최신 버전은 아직 불안정할 수 있으므로 최신버전의 아래 단계를 추천한다. 아니면 $ ubuntu-drivers devices 위의 명령어로 우분투에서 추천하는 드라이버를 확인하는 방법도 있다. $ s..

Setting, Error/GPU 2021.08.09

[Error] Error response from daemon: could not select device driver with capabilities: [gpu_name] Error: failed to start containers: [container_name]

※ nvidia-docker에서 container를 실행하지 못하는 오류 * 해결법 - 먼저 기본적으로 컴퓨터 재부팅부터 해보고 되지 않을 경우에만 실행하기를 권장드립니다. ▶ 저는 재부팅을 하고 나서 대부분 도커가 정상적으로 실행되는 경우가 많았습니다. - 관련 Docker 모듈 재설치 $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) $ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - $ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc..

Setting, Error/GPU 2021.08.06

[Error] Failed to initialize NVML: Driver/library version mismatch

apt를 업데이트 하며 apt와 cuda 및 cuda driver 버전이 서로 호환되지 않아 발생하는 문제 Ubuntu OS에서 apt 및 apt-get 업데이트 후 발생하는 에러 해결법 ( apt, apt-get update 함부로 막 하지 말기.. docker container 안에서도 하지 말기.. ) ※ 사용환경 : Ubuntu20, RTX3090 1. 사용하고 있는 nvidia 관련 환경 초기화 $ sudo apt autoremove 위 명령어로 먼저 잘못되어 있는 패키지를 자동으로 지우고 바로 2번으로 넘어가서 apt 버전에 맞는 nvidia-driver를 다시 깔아볼 것 위의 내용 (autoremove 하고, 2번으로 내려가서 드라이버 재설치)을 그대로 따라했는데도 GPU가 잡히지 않는다면,..

Setting, Error/GPU 2021.08.02