이 노트북은 대화형 노트북입니다. 로컬에서 실행하거나 아래 링크를 사용하세요:
Service API를 사용하여 트레이스를 로깅하고 조회하기
- 간단한 LLM 호출 및 응답을 모의로 생성(mock)하고 Weave에 로깅합니다.
- 더 복잡한 LLM 호출 및 응답을 모의로 생성하고 Weave에 로깅합니다.
- 로깅된 트레이스에 대해 예시 조회 쿼리를 실행합니다.
로깅된 트레이스 보기
이 가이드의 코드를 실행할 때 생성되는 모든 Weave 트레이스는 Weave 프로젝트(team_id\project_id로 지정)에 있는 Traces 탭으로 이동한 후, 트레이스 이름을 선택하여 확인할 수 있습니다.
시작하기 전에 사전 준비 사항을 완료하십시오.
사전 준비: 변수와 엔드포인트 설정
https://trace.wandb.ai/call/starthttps://trace.wandb.ai/call/endhttps://trace.wandb.ai/calls/stream_query
project_id: 트레이스를 기록할 W&B 프로젝트 이름입니다.team_id: 사용자의 W&B 팀 이름입니다.wandb_token: 사용자의 W&B API key입니다.
간단한 트레이스
간단한 트레이스 시작하기
payload_start를 생성하고 url_start 엔드포인트를 사용해 Weave에 기록합니다. payload_start 객체는 OpenAI의 gpt-4o에 Why is the sky blue?라는 질의를 보내는 호출을 모방합니다.
성공하면 이 코드는 트레이스가 시작되었음을 나타내는 메시지를 출력합니다:
간단한 trace 종료하기
payload_end를 생성하고 url_end 엔드포인트를 사용해 Weave에 로깅합니다. payload_end 객체는 Why is the sky blue?라는 쿼리에 대해 OpenAI의 gpt-4o가 반환하는 응답을 모방합니다. 이 객체는 가격 요약 정보와 chat completion이 Weave Dashboard의 trace 뷰에 생성되도록 구성되어 있습니다.
성공하면, 이 코드는 trace가 완료되었음을 나타내는 메시지를 출력합니다:
복잡한 트레이스
복잡한 트레이스 시작하기
payload_parent_start)를 초기화합니다. 여기에서 작업은 사용자 질의 Can you summarize the key points of this document?를 처리하는 것입니다.
payload_parent_start 객체는 여러 단계로 이루어진 워크플로의 첫 단계를 나타내며, url_start 엔드포인트를 사용해 Weave에 해당 작업을 로깅합니다.
성공하면, 이 코드는 상위 호출이 로깅되었음을 나타내는 메시지를 출력합니다:
RAG 문서 조회를 위한 자식 span 추가
payload_child_start 객체로 시작되며, 여기에는 다음이 포함됩니다:
trace_id: 이 자식 span을 부모 trace에 연결합니다.parent_id: 자식 span을 부모 작업과 연관시킵니다.inputs: 검색 쿼리를 로깅합니다. 예:"This is a search query of the documents I'm looking for."
url_start 엔드포인트 호출에 성공하면 코드는 자식 호출이 시작되고 완료되었음을 나타내는 메시지를 출력합니다:
LLM completion 호출에 대한 자식 span 추가
payload_child_start 객체로 시작합니다:
trace_id: 이 자식 span을 상위 trace에 연결합니다.parent_id: 자식 span을 전체 워크플로와 연결합니다.inputs: 사용자 질의와 추가된 문서 컨텍스트를 포함해 LLM에 대한 입력 메시지를 기록합니다.model: 작업에 사용된 모델을 지정합니다 (gpt-4o).
payload_child_end 객체가 output 필드에 LLM이 생성한 응답을 기록하여 트레이스를 종료합니다. 사용량 요약 정보도 함께 기록됩니다.
성공하면 코드는 LLM 자식 스팬 트레이스가 시작되고 종료되었음을 나타내는 메시지를 출력합니다:
복잡한 트레이스 종료
payload_parent_end 객체를 사용해 최종 상태로 마무리합니다:
id: 초기 부모 트레이스를 시작할 때 사용된parent_call_id.output: 전체 워크플로우의 최종 출력을 나타냅니다.summary: 전체 워크플로우에 대한 사용량 데이터를 통합합니다.prompt_tokens: 모든 프롬프트에 사용된 토큰의 총합.completion_tokens: 모든 응답에서 생성된 토큰의 총합.total_tokens: 워크플로우 전체의 토큰 총합.requests: 수행된 요청의 총 개수(이 예에서는1).
조회 쿼리 실행하기
inputs.model 필드가 gpt-4o와 동일한 trace만 필터링합니다.
query_payload 객체에는 다음이 포함됩니다:
project_id: 조회할 팀과 프로젝트를 식별합니다.filter: 쿼리가 trace root(최상위 trace)만 반환하도록 보장합니다.query:$expr연산자를 사용해 필터 로직을 정의합니다:$getField:inputs.model필드를 조회합니다.$literal:inputs.model이"gpt-4o"인 trace와 매칭합니다.
limit: 쿼리 결과를 최대 10,000개로 제한합니다.offset: 첫 번째 결과부터 쿼리를 시작합니다.sort_by: 결과를started_at타임스탬프 기준으로 내림차순 정렬합니다.include_feedback: 결과에서 피드백 데이터를 제외합니다.