이 노트북은 대화형입니다. 로컬에서 실행하거나 아래 링크를 사용하세요:
Weave와 통합하기: 프로덕션 대시보드
- Weave에서 traces, 비용, 피드백 및 기타 지표 가져오기
- 사용자 피드백과 비용 분포에 대한 집계 보기 생성
- 시간에 따른 토큰 사용량과 지연 시간 시각화 생성
streamlit을 설치하고 이 프로덕션 대시보드 스크립트를 실행하여, 자신의 Weave 프로젝트에서 이 대시보드를 바로 사용해 볼 수 있습니다!
1. 설정
2. 구현
2.1 Weave 클라이언트 초기화 및 비용 정의
- 여러 표준 모델에 대한 기본 비용을 이미 포함해 두었지만, 사용자가 직접 커스텀 비용과 커스텀 모델을 쉽게 추가할 수 있도록 설계되어 있습니다. 아래에서는 일부 모델에 커스텀 비용을 추가하고, 나머지 모델에는 기본 비용을 사용하는 방법을 보여줍니다.
- 비용은 Weave에서 각 호출마다 추적되는 토큰 수를 기반으로 계산됩니다. 많은 LLM 벤더 라이브러리의 경우 토큰 사용량을 자동으로 추적하지만, 어떤 호출이든 커스텀 토큰 수를 직접 반환할 수도 있습니다. 커스텀 모델에 대한 토큰 수와 비용 계산을 정의하는 방법은 이 쿡북을 참고하세요 - custom cost cookbook.
2.2 Weave에서 호출 데이터 가져오기
- 호출별로 데이터 가져오기
- 고수준 API 사용
2.2.1 호출 단위로 데이터 가져오기
calls_query_stream API를 사용해 Weave에서 호출 데이터를 가져올 수 있습니다:
calls_query_streamAPI: 이 API를 사용하면 Weave에서 호출 데이터를 가져올 수 있습니다.filterdictionary: 이 dictionary에는 호출 데이터를 가져오기 위한 필터 매개변수가 포함됩니다. 자세한 내용은 여기를 참고하세요.expand_columnslist: 이 list에는 호출 데이터에서 확장할 컬럼이 포함됩니다.sort_bylist: 이 list에는 호출 데이터를 정렬하기 위한 매개변수가 포함됩니다.include_costsboolean: 이 boolean은 호출 데이터에 비용 정보를 포함할지 여부를 나타냅니다.include_feedbackboolean: 이 boolean은 호출 데이터에 피드백 정보를 포함할지 여부를 나타냅니다.
2.2.2 고수준 API 사용
query_costs API를 사용하여 프로젝트에서 사용 중인 모든 LLM의 비용을 조회합니다:
2.4 입력 수집 및 시각화 생성
결론
- 데이터 입력:
- 프레임워크에 구애받지 않는 트레이싱: @weave-op() 데코레이터를 사용하거나 CSV에서 호출을 가져올 수 있습니다(관련 import 쿠크북 참고).
- 다양한 프로그래밍 프레임워크와 언어에서 Weave로 로그를 전송할 수 있는 서비스 API 엔드포인트. 자세한 내용은 여기를 참고하세요.
- 데이터 출력: