사용 가능한 모델

현재 Serverless RL은 다음과 같은 파운데이션 모델을 학습용으로 지원합니다. 특정 모델에 관심이 있다면 support로 문의하세요.

모델 카탈로그

Model	Model ID (for API usage)	Type	Context Window	Parameters	Description
OpenPipe Qwen3 14B Instruct	`OpenPipe/Qwen3-14B-Instruct`	텍스트	32.8K	14.8B (Total)	에이전트 구축을 위한 파인튜닝에 최적화된, 효율적인 다국어용 고밀도 instruction-tuned 모델로 OpenPipe에서 최적화했습니다.
Qwen3 30B A3B	`Qwen/Qwen3-30B-A3B-Instruct-2507`	텍스트	262K	3.3B-30.5B (Active-Total)	Qwen3-30B-A3B-Instruct-2507은 추론, 코딩, 긴 컨텍스트 이해 능력이 향상된 30.5B MoE 기반 instruction-tuned 모델입니다.