클러스터
이 페이지는 HPC 클러스터의 상태 및 리소스 활용률에 대한 실시간 개요를 제공합니다.
- 전체 사용량 (모든 파티션): 주요 리소스에 대한 전체 클러스터의 현재 사용량을 보여줍니다:
- 노드: 사용 가능한 전체 노드 중 활성 노드 수 (예: 4 / 5).
- CPU: 사용 가능한 전체 코어 대비 할당된 코어 수 (예: 24 / 60).
- 메모리 (GB): 사용 가능한 전체 메모리 대비 할당된 메모리 (예: 124 / 155 GB).
- GPU: 사용 가능한 전체 GPU 대비 할당된 GPU (예: 0 / 1).
- 디스크 (GB): 사용 가능한 전체 디스크 공간 대비 사용된 디스크 공간 (예: 234 / 447 GB).
- 노드 사용량 막대: 개별 노드 상태 또는 부하에 대한 시각적 표현 (예:
n001,n002등). - CPU 온도: 각 노드 CPU의 현재 온도와 최대 허용 및 임계 온도 임계값을 보여줍니다.
- 파티션 테이블: 다음 정보가 포함된 사용 가능한 Slurm 파티션 목록:
파티션: 파티션 이름 (예:hpc*,hpc).가용성: 가용성 상태 (예:up).시간 제한: 파티션의 작업에 허용된 최대 실행 시간 (예:infinite).노드: 파티션과 연결된 노드 수.상태: 파티션의 현재 상태 (예:mixed,idle).노드 목록: 파티션에 속한 노드 (예:hpc[01-04]).
- 노드 테이블: 각 개별 노드에 대한 자세한 정보:
노드: 노드 호스트 이름 (예:hpc01).파티션: 노드가 속한 파티션.상태: 노드의 현재 상태 (예:MIXED).CPU 할당: 할당된 CPU 코어 수.메모리 할당 (GB): 할당된 메모리 양.GPU 할당: 할당된 GPU 수.CPU 사용량 (%): 현재 CPU 사용률.메모리 사용량 (%): 현재 메모리 사용률.GPU 사용량 (%): 현재 GPU 사용률.
대시보드 열기 버튼
Section titled “대시보드 열기 버튼”오른쪽 상단 모서리에 있는 대시보드 열기 버튼을 클릭하면 더 자세한 기록 데이터와 세부 메트릭을 제공하는 클러스터 모니터링 대시보드 페이지가 열립니다.