메인 콘텐츠로 건너뛰기
W&B Weave는 LLM 애플리케이션을 추적·평가하고 개선할 수 있도록 도와주는 관측 및 평가 플랫폼입니다. Weave를 사용하면 다음을 수행할 수 있습니다:
  • LLM 애플리케이션을 관측하고 디버깅하기
  • LLM 판정자와 사용자 정의 스코어러를 사용해 애플리케이션의 응답을 평가하기

시작하기

다음 문서는 Weave 도구 제품군의 기본 사용 방법을 안내합니다.

퀵스타트: LLM 입력 및 출력 추적

간단한 LLM 호출을 트레이싱하고 W&B 계정에서 데이터를 확인하는 것부터 시작하세요.

애플리케이션 평가 시작하기

Weave 스코어러를 사용해 평가 파이프라인을 구축하고 애플리케이션 성능을 테스트하고 추적하는 방법을 알아보세요.

RAG 애플리케이션 평가하기

Weave와 LLM judge를 사용해 RAG 애플리케이션을 구축하고 평가하여 검색 품질을 측정하세요.

Weave 설치

W&B Weave는 Python 및 TypeScript용 라이브러리를 제공합니다. Weave 라이브러리를 설치하려면 다음 명령을 실행하세요:
pip install weave
Weave 라이브러리 사용을 시작하려면 먼저 Weights & Biases (W&B) 계정User Settings에서 API key를 생성하세요. API key를 사용해 W&B 계정에 인증하고 데이터 전송을 시작할 수 있습니다.