vLLM and High-Performance Inference
- Undertitel
- Memory Optimization, Parallel Execution, Token Streaming, and Scalable Model Serving
- Författare
- Camila Cypher
- ISBN
- 9798195860981
- Språk
- engelska
- Vikt
- 331 gram
- Utgivningsdatum
- 2026-05-06
- Förlag
- Independently Published
- Sidor
- 184

