들어가며
- 기존 제품에 GPU 장비를 추가하기위한 방법에 대해 참고할 수 있습니다.
- 해당 글을 통해 호환성 여부를 판단할 수 있습니다.
내용
GPU 장비를 구매한다면 가장 먼저 기존 제품에 사용되는 모델 코드와 호환이 되는지 확인해야합니다.
이 때, 고려되는 사항은 다음과 같습니다.
- GPU Compute Capability
- GPU CUDA 호환성
- Tensorflow 호환성
- Nvidia Driver 호환성
먼저 구매하고자하는 GPU 장비의 Compute Capability 를 알아야합니다.
딥러닝에 사용되는 Framework 요구사항을 확인했을 때, GPU 에 지원항목에서 확인할 수 있습니다.
아래 CUDA 공식 문서에서 해당 장비의 레벨을 확인할 수 있습니다.
https://developer.nvidia.com/cuda-gpus
! Compute Capability 란 연산량을 나타내는 레벨
1. CUDA 공식 문서에 접속하여 구매하고자 하는 GPU 장비를 선택합니다.
예시 ) RTX A5000
- 홈페이지 접속
- 원하는 GPU 장비 확인
: 해당 RTX A5000 장비는 Compute Capability 가 8.6 인 것을 확인할 수 있습니다.
2. CUDA 지원 범위 확인
그렇다면 연산 레벨에 맞는 CUDA 버전을 설치해야합니다.
CUDA SDK 는 Compute Capability 레벨에 따라 설치할 수 있는 범위가 지정되어 있습니다.
CUDA 공식 문서에서도 확인할 수 있습니다.
예시) 공식적으로 지원되는 범위를 한번에 정리한 사이트입니다.
https://en.wikipedia.org/wiki/CUDA
- 링크 접속
- GPUs Supports 확인 (https://en.wikipedia.org/wiki/CUDA#:~:text=11%20and%20float16.-,GPUs%20supported,-%5Bedit%5D)
- 내 장비 지원 범위 확인
RTX A5000 장비는 지원되는 CUDA SDK 가 11.1~12.0 인 것을 확인할 수 있습니다.
3. Tensorflow 지원 범위 확인
강화학습, 딥러닝 등 학습 코드를 실행할 때, Tensorflow 를 사용합니다.
Tensorflow 를 사용하기 위해서는 CUDA 호환성을 확인해야합니다.
아래 Tensorflow 공식 문서를 확인해 지원되는 Tensorflow 버전을 확인합니다.
https://www.tensorflow.org/install/source?hl=ko#gpu
- 링크 접속
- CUDA 지원 범위 확인
: 2 번에서 확인한 "RTX A5000" 장비에 해당하는 CUDA 버전은 11.1~ 12.0입니다.
따라서 CUDA 버전에 맞게 TF 버전을 확인합니다.
cuDNN 을 설치한다면 TF 버전에 호환되도록 동일한 문서에서 버전을 확인한 뒤 설치하도록 합니다.
4. Nvidia Driver 호환성
설치할 CUDA 버전을 지정했다면 설치할 Nvidia Driver 버전을 확인해야합니다.
CUDA 공식 문서에서 호환성에 대해 확인할 수 있습니다.
CUDA 는 현재 마이너 호환이 가능하다고 공식적으로 발표된 바 있습니다.
따라서 권장하는 최소 Nvidia Driver 버전 이상을 설치하면 됩니다.
- 최소 지원 범위 확인
- 권장 버전 확인
권장 버전은 CUDA Nvidia Driver Download 페이지에서 확인할 수 있습니다.
https://www.nvidia.co.kr/Download/index.aspx?lang=kr
결과
: RTX A5000 장비는 권장버전 525.89.02 인 것을 확인할 수 있으며 "4-a. 최소 지원 범위"에도 호환되는 것을 확인할 수 있습니다.
마무리
- 기존에 제품에서 수행되는 학습코드를 추가할 GPU 에서 실행하고 싶다면, 해당 문서를 참고하여 호환되는 GPU 장비를 찾을 수도 있습니다.
아티클이 유용했나요?
훌륭합니다!
피드백을 제공해 주셔서 감사합니다.
도움이 되지 못해 죄송합니다!
피드백을 제공해 주셔서 감사합니다.
피드백 전송
소중한 의견을 수렴하여 아티클을 개선하도록 노력하겠습니다.