Spara

Hands-On LLM Serving and Optimization

Författare:

Chi Wang, Peiheng Hu

e-bok

, 2026

Engelska

881 kr

Läs i Adobe DRM-kompatibel e-boksläsareDen här e-boken är kopieringsskyddad med Adobe DRM vilket påverkar var du kan läsa den. Läs mer

Large language models (LLMs) are the reasoning engines of modern AI. Today, a major inflection point has arrived: as the world races to deploy AI at scale, model inference has moved to the center of the stack. Welcome to the inference era. Without proper optimization, however, LLMs can be expensive and slow to serve. Hands-On LLM Serving and Optimization is a comprehensive guide to the complexities of deploying and optimizing LLMs at scale.In this hands-on, engineering-focused book, authors Chi Wang and Peiheng Hu combine practical examples, code, and strategies for building robust, performant, and cost-efficient AI token factories. Whether you re building the LLM inference infrastructure or the applications that consume it, a deep understanding of LLM serving will make you a more effective, future-ready engineer as AI transforms how we work and build.Learn the foundations of model serving with core concepts, design paradigms, and industry best practicesUnderstand the common challenges of hosting LLMs at scaleBalance latency and throughput to meet the demands of AI applications and business requirementsHost LLMs cost-effectively with practical, code-backed techniques

Undertitel: Hosting LLMs at Scale
Författare: Chi Wang, Peiheng Hu
ISBN: 9798341621473
Språk: Engelska
Utgivningsdatum: 2026-05-11
Förlag: O'Reilly Media
Tillgängliga elektroniska format: PDF - Adobe DRM
Läs e-boken här: E-boksläsare i mobil/surfplatta
Läsplatta
Dator

Leverans

Digitala e-böcker och ljudböcker levereras direkt efter köpet och blir då tillgängliga i det digitala biblioteket under ditt konto. För fysiska produkter har vi gratis ekonomifrakt för privatpersoner från 249 kr. Vi erbjuder leverans till ombud, direkt till din brevlåda eller dörr, paketskåp, och hemleverans. Vilka leveransalternativ som är tillgängliga för dig framgår i kassan. Leveranstiden kan variera beroende på leveranssätt, adress, och om din beställning innehåller produkter med längre leveranstider. Den totala leveranstiden visas i kassan.

City Mail

Betalning

Du kan välja att betala med Apple Pay, kort (Visa eller Mastercard), eller via Klarna där du kan betala med Swish, kort, direktbetalning, faktura eller delbetalning. Genom att klicka på "Betala köp" godkänner du Kustoms och Adlibris allmänna villkor. Du kan ta del av hur dina personuppgifter behandlas i Adlibris personuppgiftspolicy, och i Kustoms dataskyddsinformation.

Returer

Hos Adlibris har du alltid 28 dagars ångerrätt från det att du mottagit din produkt. Returavgiften är 59 kr. Nedladdningsbara produkter omfattas inte av ångerrätten eftersom de levereras direkt efter köpet. För mer information om returer, återbetalning och reklamation, läs våra köpvillkor.

Hands-On LLM Serving and Optimization

Beskrivning

Produktinfo