본문으로 건너뛰기
Creeta
제품
뉴스
GitHub
EN
1 건
#llm-inference
오픈소스
#vllm
#llm-inference
#open-source
#production
vLLM v0.21.0 프로덕션 업데이트: KV 오프로드와 멀티 서버 포트 버그
v0.22.0은 아직 존재하지 않습니다. v0.21.0은 KV 오프로드, 스펙 디코드, 그리고 검토 중인 멀티 서버 포트 버그를 포함합니다.
Creeta
2026년 5월 29일
표시 중
1
/ 1 건