Reinforcement Learning from Human Feedback

Kirjailija:

Nathan Lambert

Nidottu

, 2026

englanti

45,80 €

Kirja ei ole vielä ilmestynyt

AI models are powerful, but they do not always behave as expected. They can give unhelpful or incorrect answers. To improve them, we need to guide them toward responses that are useful and safe. This book shows how to do this using Reinforcement Learning from Human Feedback (RLHF). It explains the main method used to train today’s advanced AI models. Learn the complete process for training AI with feedback from people. Understand how to collect human opinions and use them to guide an AI. Build a model that teaches the AI what a good answer looks like. Discover new, simpler ways to train AI, like Direct Preference Optimisation (DPO). Find out how to test your AI to make sure it is becoming more helpful and safe. The RLHF Book is the first complete guide to training AI with human feedback. Written by a leading expert who helped create these methods, this book gives you a clear plan to follow. It covers everything from getting data to training and testing your AI. After reading this book, you will have the skills to build AI models that are more helpful, safe and act as expected. This book is for engineers, AI scientists and students who want to learn how to train modern AI.

Kirjailija: Nathan Lambert
ISBN: 9781633434301
Kieli: englanti
Paino: 240 grammaa
Julkaisupäivä: 7.10.2026
Kustantaja: Manning Publications
Sivumäärä: 225

Toimitus

Ilmainen toimitus yksityisasiakkaille yli 29 euron tilauksiin. Tarjoamme toimituksen noutopisteeseen, suoraan postilaatikkoosi tai ovelle, pakettiautomaattiin tai kotiinkuljetuksena. Saatavilla olevat toimitusvaihtoehdot näkyvät kassalla. Toimitusaika voi vaihdella toimitustavan, osoitteen ja tilauksesi sisältämien tuotteiden pidempien toimitusaikojen mukaan. Arvioitu kokonaisaika toimitukselle ilmoitetaan kassalla.

DSV

Maksaminen

Voit maksaa MobilePaylla, kortilla (Visa tai Mastercard), Apple Paylla tai Klarnalla. Klarnan maksuvaihtoehdot ovat: korttimaksu, verkkopankkimaksu, lasku tai osamaksu. Klikkaamalla "Maksa tilaus" hyväksyt Kustomsin ja Adlibriksen yleiset ehdot. Voit tutustua henkilötietojesi käsittelyyn Adlibriksen tietosuojakäytännössä ja Kustomsin tietosuojainformaatiossa.

Palautukset

Adlibriksella sinulla on aina 28 päivän palautusoikeus siitä hetkestä, kun olet vastaanottanut tuotteesi. Palautusmaksu on 5,90 euroa. Peruuttamisoikeus ei koske tuotteita, jotka toimitetaan sähköisesti ja ovat ladattavissa tilauksen vahvistushetkestä alkaen. Lisätietoja palautuksista, hyvityksistä ja reklamaatioista löydät ostoehdoistamme.

Reinforcement Learning from Human Feedback

Toimitus

Maksaminen

Palautukset

Lisätietoa Adlibriksesta

Tietoa Adlibriksesta

Edulliset hinnat

Sujuvat toimitukset

Ilmainen toimitus yli 29 € tilauksiin*

Tilaa uutiskirje

Usein kysyttyä

Lisätietoa Adlibriksesta

Tietoa Adlibriksesta

Edulliset hinnat

Sujuvat toimitukset

Ilmainen toimitus yli 29 € tilauksiin*

Tilaa uutiskirje

Usein kysyttyä

Toimitus

Maksaminen

Palautukset

Reinforcement Learning from Human Feedback

Kuvaus

Tuotetiedot

Toimitus ja maksaminen

Toimitus

Maksaminen

Palautukset

Arvostelut

Tutustu tuotekokoelmiin

Lisätietoa Adlibriksesta

Tietoa Adlibriksesta

Edulliset hinnat

Sujuvat toimitukset

Ilmainen toimitus yli 29 € tilauksiin*

Tilaa uutiskirje

Usein kysyttyä

Lisätietoa Adlibriksesta

Tietoa Adlibriksesta

Edulliset hinnat

Sujuvat toimitukset

Ilmainen toimitus yli 29 € tilauksiin*

Tilaa uutiskirje

Usein kysyttyä

Toimitus ja maksaminen

Toimitus

Maksaminen

Palautukset