Docker 통합
로컬 개발
wandb docker는 Docker 컨테이너를 시작하고, wandb 환경 변수를 전달하며, 사용자의 코드를 마운트하고, wandb가 설치되어 있도록 보장하는 명령입니다. 기본적으로 이 명령은 TensorFlow, PyTorch, Keras, Jupyter가 설치된 Docker 이미지를 사용합니다. 동일한 명령으로 사용자의 Docker 이미지를 시작할 수도 있습니다: wandb docker my/image:latest. 이 명령은 현재 디렉터리를 컨테이너의 “/app” 디렉터리에 마운트하며, “—dir” 플래그를 사용해 이 경로를 변경할 수 있습니다.
프로덕션
wandb docker-run 명령은 프로덕션 워크로드를 위해 제공됩니다. 이 명령은 nvidia-docker를 그대로 대체할 수 있는 드롭인 대체용으로 설계되었습니다. 이는 docker run 명령을 간단히 래핑하여 호출 시 자격 증명과 WANDB_DOCKER 환경 변수를 추가합니다. “—runtime” 플래그를 전달하지 않고 머신에 nvidia-docker가 사용 가능한 경우, 런타임이 nvidia로 설정되도록 보장합니다.
Kubernetes
복원
wandb restore username/project:run_id를 호출하면 코드를 복원하는 새 브랜치를 체크아웃한 다음, 학습에 사용된 것과 동일한 Docker 이미지를 원래 명령어가 미리 입력된 상태로 실행합니다.