Аннотация
Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и мета-алгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.

![Оглавление
Статьи
Nintendo ставит на 3D и дополненную реальность Автор: Андрей Письменный
Как изобрели интегральную схему Автор: Юрий Ильин
Телефон... Цифровой журнал «Компьютерра» № 53 [24.01.2011 — 30.01.2011]](https://www.rulit.me/kotha/images/nocover.jpg)

![Книга предназначена для пользователей, желающих самостоятельно создавать и редактировать электронные книги в популярном формате FictionBook. Подробно описан сам... Создание электронных книг в формате FictionBook 2.1: практическое руководство [Release 1.01 от 28.II.2010 г.]](https://www.rulit.me/data/programs/images/sozdanie-elektronnyh-knig-v-formate-fictionbook-2-1-praktich_171807.jpg)




Комментарии к книге "Алгоритмы обучения с подкреплением на Python"