일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- LLM
- 멀티모달
- AI 기술
- 아두이노
- 우분투
- AI
- ubuntu
- 메타
- 뉴럴링크
- 인공지능
- 생성형 AI
- 티스토리챌린지
- 딥마인드
- tts
- 확산 모델
- 트랜스포머
- ChatGPT
- LORA
- 일론 머스크
- 오블완
- PYTHON
- ControlNet
- OpenAI
- javascript
- 가상환경
- TRANSFORMER
- 시간적 일관성
- 이미지 편집
- 오픈AI
- 서보모터
- Today
- Total
목록nvidia-smi (2)
AI 탐구노트
필요성 NVIDIA GPU를 사용하면서, AI 모델 추론이나 학습을 시키면서 남아 있거나 현재 사용 중인 GPU 현황이 궁금했던 적이 있을 겁니다. 모델 하나를 더 로딩하려다가 GPU 사용량 초과, 메모리 부족 등으로 인해 문제가 생기는 경우가 발생할 수 있기 때문이죠. 프레임워크에서 알아서 완벽하게 처리를 해 주면 좋겠지만 그렇지 못한 경우들이 종종 나타날 수 있기 때문에 서비스를 제공하는 입장에서는 항상 모니터링을 할 수 있도록 준비를 해 두는 것이 필요할 수 있습니다. 방법GPU 현황을 확인하는 방법은 다음과 같은 것들이 있습니다 . 1.별도의 창에서 nvidia-smi, nvitop 과 같은 외부 도구를 이용해 별도로 모니터링2.pycuda, pynvml 등의 NVIDIA python 패키지를..
우분투 24.04 LTS로 업그레이드 하고나서 패키지 업데이트를 한다고 해서 허락했더니 재부팅 후 역시나 다음과 같은 오류가 발생했습니다.$ nvidia-smiFailed to initialize NVML: Driver/library version mismatchNVML library version: 545.23 위의 오류는 NVIDIA GPU의 driver 버전이 커널의 것과 다를 경우에 나오는 것이라고 알려져 있습니다. 최근 업데이트를 통해 설치된 현재의 커널이 사용 중인 버전은 535.183.01 이네요... (아래 그림 참조)$ modinfo nvidiafilename: /lib/modules/6.8.0-41-generic/updates/dkms/nvidia.ko.zstfirmware..