컨텐츠로 건너뛰기

클러스터

이 페이지는 HPC 클러스터의 상태 및 리소스 활용률에 대한 실시간 개요를 제공합니다.

클러스터 모니터링 화면
  • 전체 사용량 (모든 파티션): 주요 리소스에 대한 전체 클러스터의 현재 사용량을 보여줍니다:
    • 노드: 사용 가능한 전체 노드 중 활성 노드 수 (예: 4 / 5).
    • CPU: 사용 가능한 전체 코어 대비 할당된 코어 수 (예: 24 / 60).
    • 메모리 (GB): 사용 가능한 전체 메모리 대비 할당된 메모리 (예: 124 / 155 GB).
    • GPU: 사용 가능한 전체 GPU 대비 할당된 GPU (예: 0 / 1).
    • 디스크 (GB): 사용 가능한 전체 디스크 공간 대비 사용된 디스크 공간 (예: 234 / 447 GB).
  • 노드 사용량 막대: 개별 노드 상태 또는 부하에 대한 시각적 표현 (예: n001, n002 등).
  • CPU 온도: 각 노드 CPU의 현재 온도와 최대 허용 및 임계 온도 임계값을 보여줍니다.
  • 파티션 테이블: 다음 정보가 포함된 사용 가능한 Slurm 파티션 목록:
    • 파티션: 파티션 이름 (예: hpc*, hpc).
    • 가용성: 가용성 상태 (예: up).
    • 시간 제한: 파티션의 작업에 허용된 최대 실행 시간 (예: infinite).
    • 노드: 파티션과 연결된 노드 수.
    • 상태: 파티션의 현재 상태 (예: mixed, idle).
    • 노드 목록: 파티션에 속한 노드 (예: hpc[01-04]).
  • 노드 테이블: 각 개별 노드에 대한 자세한 정보:
    • 노드: 노드 호스트 이름 (예: hpc01).
    • 파티션: 노드가 속한 파티션.
    • 상태: 노드의 현재 상태 (예: MIXED).
    • CPU 할당: 할당된 CPU 코어 수.
    • 메모리 할당 (GB): 할당된 메모리 양.
    • GPU 할당: 할당된 GPU 수.
    • CPU 사용량 (%): 현재 CPU 사용률.
    • 메모리 사용량 (%): 현재 메모리 사용률.
    • GPU 사용량 (%): 현재 GPU 사용률.

오른쪽 상단 모서리에 있는 대시보드 열기 버튼을 클릭하면 더 자세한 기록 데이터와 세부 메트릭을 제공하는 클러스터 모니터링 대시보드 페이지가 열립니다.