K8S (1) 썸네일형 리스트형 [NVIDIA] AI 인프라 및 운영 - ③ AI 운영 13. AI 데이터 센터 관리 및 모니터링13.1 Key Messages클러스터 관리 (Cluster Management)인프라 프로비저닝 (Infrastructure Provisioning)자원 관리 (Resource Management)작업 관리 (Workload Management)프로비저닝 (Provisioning Tools) : 프로비저닝은 하드웨어에 소프트웨어와 드라이버를 설치하는 과정모니터링 도구 (Monitoring Tools) : 모니터링은 AI 인프라 및 해당 소프트웨어, 서비스, 실행 중인 작업(job)의 상태와 매트릭을 확인하는 과정을 포함작업 관리 (Workload Management) : 자원할당, 작업 스케줄링 (Scheduling Jobs), 자원 사용량 모니터링 (Monit.. 이전 1 다음