메인 콘텐츠로 건너뛰기
W&B에 기록하는 머신 러닝 실험 동안 GPU 장애, 온도 위반(thermal violation) 등 인프라 알림을 확인할 수 있습니다. W&B 실행 중에는 CoreWeave Mission Control이 사용 중인 컴퓨트 인프라를 모니터링합니다.
이 기능은 프리뷰(Preview) 상태이며 CoreWeave 클러스터에서 학습할 때만 사용할 수 있습니다. 액세스 권한을 얻으려면 W&B 담당자에게 문의하세요.
오류가 발생하면 CoreWeave는 해당 정보를 W&B로 전송합니다. W&B는 인프라 정보를 프로젝트 작업 공간의 해당 실행 플롯에 표시합니다. CoreWeave는 일부 문제를 자동으로 해결하려 시도하며, W&B는 해당 정보를 실행 페이지에 표시합니다.