
LLM Inference in C++
- Undertittel
- Building High-Throughput Engines with PagedAttention and CUDA Kernels
- Forfatter
- Billie S Lightner
- ISBN
- 9798259069299
- Språk
- Engelsk
- Vekt
- 454 gram
- Utgivelsesdato
- 19.5.2026
- Forlag
- Independently Published
- Antall sider
- 284
