메인 콘텐츠로 건너뛰기
PaddleOCR는 사용자가 더 나은 모델을 학습하고 이를 PaddlePaddle 기반의 실제 환경에 적용할 수 있도록, 다국어를 지원하는 우수하고 업계 선도 수준의 실용적인 OCR 도구를 제공하는 것을 목표로 합니다. PaddleOCR는 OCR과 관련된 다양한 최첨단 알고리즘을 지원하며, 산업용 솔루션을 개발해 왔습니다. 현재 PaddleOCR에는 학습 및 평가 지표와 함께 모델 체크포인트와 해당 메타데이터를 로깅하기 위한 W&B와의 통합 기능이 포함되어 있습니다.

예제 블로그 및 Colab

PaddleOCR를 사용해 ICDAR2015 데이터셋으로 모델을 학습하는 방법은 여기에서 확인할 수 있습니다. 이에 대한 Google Colab도 함께 제공되며, 해당 라이브 W&B 대시보드는 여기에서 볼 수 있습니다. 이 블로그의 중국어 버전도 여기에서 확인할 수 있습니다: W&B对您的OCR模型进行训练和调试

가입하고 API key 생성하기

API key는 사용자의 머신을 W&B에 인증하는 데 사용됩니다. API key는 사용자 프로필에서 생성할 수 있습니다.
보다 간편하게 설정하려면 User Settings로 바로 이동해 API key를 생성하세요. 새로 생성된 API key는 즉시 복사하여 비밀번호 관리자와 같은 안전한 위치에 저장하세요.
  1. 오른쪽 상단의 사용자 프로필 아이콘을 클릭합니다.
  2. User Settings를 선택한 다음, 아래로 스크롤하여 API Keys 섹션으로 이동합니다.

로컬 환경에 wandb 라이브러리를 설치하고 로그인하기

로컬 환경에 wandb 라이브러리를 설치하고 로그인하려면 다음을 수행합니다:
  1. WANDB_API_KEY 환경 변수를 본인의 API key로 설정합니다.
    export WANDB_API_KEY=<your_api_key>
    
  2. 다음 명령으로 wandb 라이브러리를 설치하고 로그인합니다.
    pip install wandb
    
    wandb login
    

config.yml 파일에 wandb 추가하기

PaddleOCR는 YAML 구성 파일을 통해 설정 변수를 전달받습니다. 구성 YAML 파일의 끝에 다음 코드를 추가하면, 모든 학습 및 검증 지표가 모델 체크포인트와 함께 자동으로 W&B 대시보드에 기록됩니다:
Global:
    use_wandb: True
wandb.init()에 전달하려는 추가적인 선택적 인자는 YAML 파일의 wandb 헤더 아래에 추가할 수도 있습니다:
wandb:  
    project: CoolOCR  # (선택 사항) wandb 프로젝트 이름입니다 
    entity: my_team   # (선택 사항) wandb 팀을 사용하는 경우 여기에 팀 이름을 전달할 수 있습니다
    name: MyOCRModel  # (선택 사항) wandb 실행의 이름입니다

config.yml 파일을 train.py에 전달하기

이 YAML 파일은 이후 PaddleOCR 리포지토리에 있는 학습 스크립트에 인수로 전달됩니다.
python tools/train.py -c config.yml
W&B가 활성화된 상태에서 train.py 파일을 실행하면 W&B 대시보드로 이동할 수 있는 링크가 생성됩니다:
PaddleOCR 학습 대시보드
PaddleOCR 검증 대시보드
텍스트 감지 모델 대시보드

피드백 또는 문제 신고

W&B 통합과 관련된 피드백이나 문제가 있다면 PaddleOCR GitHub에 이슈를 열거나 support@wandb.com으로 이메일을 보내 주세요.