Аннотация
Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и мета-алгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.
![This book is intended as an introduction to numerical methods for scientists and engineers. Providing an excellent balance of theoretical and applied topics, it shows the numerical methods used with C, C++, and MATLAB.
Provides a balance of theoretical and applied topics
Shows the numerical... Numerical Methods in Engineering and Science [C, C++, and MATLAB]](https://www.rulit.me/kotha/images/nocover.jpg)
![Машинное обучение преображает науку, технологию, бизнес и позволяет глубже узнать природу и человеческое поведение. Программирующие сами себя компьютеры — одна... Верховный алгоритм [Как машинное обучение изменит наш мир]](https://www.rulit.me/data/programs/images/verhovnyj-algoritm-kak-mashinnoe-obuchenie-izmenit-nash-mir_510165.jpg)
![Эта книга идеально подходит как для начинающих программистов, так и для тех, кто только собирается осваивать Python, но уже имеет опыт программирования на других... Простой Python [Современный стиль программирования]](https://www.rulit.me/data/programs/images/prostoj-python-sovremennyj-stil-programmirovaniya_502578.jpg)


![Algorithms [Notes for... Algorithms [Notes for Professionals]](https://www.rulit.me/data/programs/images/algorithms-notes-for-professionals_606926.jpg)

![I am not a recruiter. I am a software engineer. And as such, I know what it Cracking the Coding Interview: 189 Programming Questions and Solutions [6th Edition]](https://www.rulit.me/data/programs/images/cracking-the-coding-interview-189-programming-questions-and_491615.jpg)
Комментарии к книге "Алгоритмы обучения с подкреплением на Python"