가격
추론
Training
모델 스토리지
제한사항
-
추론 동시성 제한: 기본적으로 Serverless RL은 현재 사용자당 최대 2000개, 프로젝트당 최대 6000개의 동시 요청을 지원합니다. 동시성 한도를 초과하면 Inference API는
429 Concurrency limit reached for requests응답을 반환합니다. 이 오류를 피하려면 학습 작업 또는 프로덕션 워크로드에서 한 번에 보내는 동시 요청 수를 줄이십시오. 더 높은 동시성 한도가 필요한 경우 support@wandb.com으로 문의하여 상향을 요청할 수 있습니다. - 지역 제한: Serverless RL은 지원되는 지역에서만 사용할 수 있습니다. 자세한 내용은 서비스 약관을 참조하십시오.