이 노트북은 대화형입니다. 로컬에서 실행하거나 아래 링크를 통해 사용할 수 있습니다:
평가에서 preprocess_model_input과 함께 Hugging Face Datasets 사용하기
참고: 임시 우회 방법
이 가이드는 Weave 평가에서 HuggingFace Datasets를 사용하기 위한 임시 우회 방법을 보여줍니다.
우리는 이 과정을 더 단순하게 만들 수 있는, 보다 원활한 통합 기능을 적극적으로 개발 중입니다.
이 방법은 동작하지만, 가까운 시일 내에 외부 데이터셋을 더 직관적으로 사용할 수 있도록 개선과 업데이트가 이루어질 예정입니다.
설정 및 임포트
HuggingFace 데이터셋 로드 및 준비
- HuggingFace 데이터셋을 로드합니다.
- 데이터셋 행을 참조하기 위한 인덱스 매핑을 생성합니다.
- 이 인덱스 방식은 원본 데이터셋에 대한 참조를 유지할 수 있게 해 줍니다.
Note:
인덱스에서는 각 행이 고유한 식별자를 가지도록hf_id와 함께hf_hub_name을 인코딩합니다. 이 고유한 다이제스트 값은 평가 시 특정 데이터셋 항목을 추적하고 참조하는 데 사용됩니다.
전처리 및 평가 함수 정의
처리 파이프라인
preprocess_example: 인덱스 참조를 평가에 필요한 실제 데이터로 변환합니다hf_eval: 모델 출력에 대한 점수 계산 방식을 정의합니다function_to_evaluate: 평가할 실제 함수/모델입니다
평가 생성 및 실행
- hf_index의 각 인덱스에 대해:
preprocess_example이 HF 데이터셋에서 해당 데이터를 가져옵니다.- 전처리된 데이터가
function_to_evaluate에 전달됩니다. - 출력에 대해
hf_eval을 사용해 점수를 계산합니다. - 결과는 Weave에서 추적됩니다.