spacy train과 함께 W&B를 사용하여 spaCy 모델의 학습 지표를 추적하고, 모델과 데이터셋을 저장 및 버전 관리할 수 있습니다. 이 모든 것은 설정 파일에 몇 줄만 추가하면 됩니다.
회원가입 및 API key 생성
보다 간편하게 설정하려면 User Settings로 바로 이동해 API key를 생성하세요. 새로 생성된 API key는 즉시 복사하여 비밀번호 관리자와 같은 안전한 위치에 저장하세요.
- 오른쪽 상단에서 사용자 프로필 아이콘을 클릭합니다.
- User Settings를 선택한 다음 아래로 스크롤하여 API Keys 섹션으로 이동합니다.
wandb 라이브러리를 설치하고 로그인하기
wandb 라이브러리를 설치하고 로그인하려면:
- Command Line
- Python
- Python notebook
-
WANDB_API_KEY환경 변수를 API key 값으로 설정합니다. -
wandb라이브러리를 설치하고 로그인합니다.
spaCy config 파일에 WandbLogger 추가하기
[training.logger] 섹션 아래에 @loggers 키에 "spacy.WandbLogger.v3" 값을 지정하고, project_name도 추가로 설정해야 합니다.
spaCy 학습 config 파일이 어떻게 작동하는지와, 학습을 커스터마이즈하기 위해 지정할 수 있는 다른 옵션들에 대한 자세한 내용은 spaCy’s documentation을 참고하세요.
| Name | Description |
|---|---|
project_name | str. W&B Project의 이름입니다. Project가 아직 없으면 자동으로 생성됩니다. |
remove_config_values | List[str] . W&B로 업로드하기 전에 config에서 제외할 값들의 목록입니다. 기본값은 [] 입니다. |
model_log_interval | Optional int. 기본값은 None 입니다. 설정하면 model versioning이 Artifacts와 함께 활성화됩니다. 모델 체크포인트 로깅 간 대기할 스텝 수를 전달하세요. 기본값은 None 입니다. |
log_dataset_dir | Optional str. 경로를 지정하면 학습 시작 시점에 데이터셋이 아티팩트로 업로드됩니다. 기본값은 None 입니다. |
entity | Optional str . 지정하면 실행이 해당 엔터티 내에서 생성됩니다. |
run_name | Optional str . 지정하면 실행이 지정한 이름으로 생성됩니다. |
학습 시작
WandbLogger를 spaCy 학습 설정에 추가했다면, 평소처럼 spacy train을 실행하면 됩니다.
- 명령줄
- Python
- Python notebook