메인 콘텐츠로 건너뛰기
현재 Serverless RL은 다음과 같은 파운데이션 모델을 학습용으로 지원합니다. 특정 모델에 관심이 있다면 support로 문의하세요.

모델 카탈로그

ModelModel ID (for API usage)TypeContext WindowParametersDescription
OpenPipe Qwen3 14B InstructOpenPipe/Qwen3-14B-Instruct텍스트32.8K14.8B (Total)에이전트 구축을 위한 파인튜닝에 최적화된, 효율적인 다국어용 고밀도 instruction-tuned 모델로 OpenPipe에서 최적화했습니다.
Qwen3 30B A3BQwen/Qwen3-30B-A3B-Instruct-2507텍스트262K3.3B-30.5B (Active-Total)Qwen3-30B-A3B-Instruct-2507은 추론, 코딩, 긴 컨텍스트 이해 능력이 향상된 30.5B MoE 기반 instruction-tuned 모델입니다.