TypeScript용 Weave 빠른 시작 가이드
- 언어 모델 입력, 출력 및 트레이스를 로깅하고 디버깅할 수 있습니다
- 언어 모델 활용 사례에 대해 동일 조건에서 공정하게 비교 가능한 엄밀한 평가를 구축할 수 있습니다
- 실험부터 평가, 프로덕션까지 LLM 워크플로 전반에서 생성되는 모든 정보를 체계적으로 정리할 수 있습니다
함수 추적
weave.op 래퍼를 추가하세요.
weave.op을 추가하고 해당 함수를 호출한 뒤, W&B 대시보드로 이동해 프로젝트 내에서 함수가 어떻게 추적되고 있는지 확인하세요.
코드는 자동으로 추적됩니다. UI의 코드 탭을 확인하세요!
OpenAI 통합
- 토큰 사용량
- API 비용
- 요청/응답 쌍
- 모델 구성
OpenAI 외에도 Weave는 Anthropic 및 Mistral과 같은 다른 LLM 제공자의 자동 로깅을 지원합니다. 전체 목록은 통합 문서의 LLM 제공자를 참조하세요.
중첩 함수 추적
- 애플리케이션 로직 흐름에 대한 완전한 가시성
- 복잡한 연산 체인의 손쉬운 디버깅
- 성능을 최적화할 수 있는 다양한 기회
데이터셋 관리
weave.Dataset 클래스를 사용해 Weave에서 데이터셋을 생성하고 관리할 수 있습니다. Weave Models와 마찬가지로 weave.Dataset은 다음과 같은 작업에 도움이 됩니다:
- 데이터를 추적하고 버전 관리하기
- 테스트 케이스 구성하기
- 팀 구성원 간 데이터셋 공유하기
- 체계적인 평가 수행하기
평가 프레임워크
Evaluation 클래스를 통해 평가 주도형 개발을 지원합니다. Evaluation은 GenAI 애플리케이션을 신뢰성 있게 반복·개선하는 데 도움을 줍니다. Evaluation 클래스는 다음을 수행합니다:
Dataset에 대한Model성능 평가- 사용자 정의 점수 함수 적용
- 상세한 성능 보고서 생성
- 모델 버전 간 성능 비교 지원
main 함수는 모든 데모를 실행합니다.