시작하기
weave.init(project=...)을 호출하면 됩니다. project 인자를 사용해 team-name/project-name 형식으로 특정 W&B 팀 이름에 기록하거나, project-name만 사용하여 기본 팀/엔터티에 기록할 수 있습니다.
호출 메타데이터 추적
weave.attributes 컨텍스트 매니저를 사용할 수 있습니다. 이 컨텍스트 매니저를 사용하면 파이프라인 실행이나 평가 배치와 같은 특정 코드 블록에 대해 커스텀 메타데이터를 설정할 수 있습니다.
트레이스
- 파이프라인 실행 단계
- Judge 유닛 평가
- 레이어 변환
- 풀링 연산
- 커스텀 유닛 및 변환
파이프라인 트레이싱 예시
- 주요 Pipeline 실행
- Layer 내 각 JudgeUnit 평가
- MeanPoolUnit 집계 단계
- 각 연산에 대한 소요 시간 정보
구성
weave.init()를 호출하면 Verdict 파이프라인에 대한 트레이싱이 자동으로 활성화됩니다. 이 통합은 Pipeline.__init__ 메서드를 패치하여, 모든 트레이스 데이터를 Weave로 전달하는 VerdictTracer를 주입하는 방식으로 동작합니다.
추가 구성은 필요하지 않습니다. Weave는 자동으로 다음을 수행합니다:
- 모든 파이프라인 연산을 캡처합니다
- 실행 시간을 추적합니다
- 입력과 출력을 로깅합니다
- 트레이스 계층 구조를 유지합니다
- 동시 실행되는 파이프라인을 처리합니다
커스텀 트레이서와 Weave
VerdictTracer를 이들과 병행해서 사용할 수 있습니다.
모델과 평가
weave.Model을(를) 사용하면 프롬프트, 파이프라인 구성, 평가 매개변수와 같은 실험 세부 정보를 기록하고 정리할 수 있어, 서로 다른 iteration을 더 쉽게 비교할 수 있습니다.
다음 예시는 Verdict 파이프라인을 WeaveModel로 감싸는 방법을 보여줍니다:
평가
weave.Evaluation 클래스를 사용하면 특정 작업이나 데이터셋에서 Verdict 파이프라인이 얼마나 잘 수행되는지 기록하고 측정할 수 있습니다: