W&B를 머신러닝 모델을 위한 GitHub라고 생각해 보세요. 머신러닝 실험을 비공개 호스팅 대시보드에 안전하게 저장할 수 있습니다. 스크립트를 어디에서 실행하든, 모델의 모든 버전이 저장된다는 확신을 갖고 빠르게 실험을 반복할 수 있습니다.W&B의 경량 통합 기능은 어떤 Python 스크립트와도 함께 동작하며, 모델을 추적하고 시각화하기 위해 필요한 것은 무료 W&B 계정에 가입하는 것뿐입니다.Hugging Face Transformers 리포지토리에서는 Trainer에 계측을 추가하여, 각 로깅 단계마다 학습 및 평가 지표를 W&B에 자동으로 로깅하도록 설정해 두었습니다.통합이 어떻게 동작하는지에 대한 더 자세한 내용은 다음을 참고하세요: Hugging Face + W&B Report.
다음으로, 다운로드한 학습 스크립트 run_glue.py를 실행하면 학습 과정이 자동으로 W&B 대시보드에 추적되는 것을 확인할 수 있습니다. 이 스크립트는 Microsoft Research Paraphrase Corpus(두 문장이 의미적으로 동등한지에 대해 사람이 주석을 단 문장 쌍으로 구성된 데이터셋)에서 BERT를 파인튜닝합니다.
위에 출력된 링크를 클릭하거나 wandb.ai에 접속해 실시간으로 결과가 들어오는 모습을 확인하세요. 브라우저에서 실행을 확인할 수 있는 링크는 모든 의존성이 로드된 후에 표시됩니다. 다음과 같은 출력 내용을 찾으세요: “wandb: View run at [URL to your unique run]”모델 성능 시각화
수십 개의 실험을 한눈에 비교하고, 흥미로운 결과를 확대해 살펴보며, 고차원 데이터를 시각화할 수 있습니다.
아키텍처 비교
다음은 BERT vs DistilBERT를 비교한 예시입니다. 자동 선 그래프 시각화를 통해, 서로 다른 아키텍처가 학습 전체에 걸쳐 평가 정확도에 어떤 영향을 미치는지 쉽게 확인할 수 있습니다.