Эта книга – подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
После покупки предоставляется дополнительная возможность скачать книгу в формате epub.
Также имеется ФРАГМЕНТ ТЕКСТА для ознакомления!
Коротко о главном в электронной версии о информационной безопасности с идентификатором 64086481:
Максим Лапань, С. Белов, К. Синица работа на тему безопасности в информационном пространстве базы данных, интернет, информационная безопасность, программирование
Ниже приведены ТЕГИ, по которым можно посмотреть аналоги книг о безопасности в сети.
Скачать Глубокое обучение с подкреплением. AlphaGo и другие технологии (pdf+epub) ОнЛайн
Электронная книга Для профессионалов (Питер) в жанре базы данных, интернет, информационная безопасность, программирование web-технологии, библиотека программиста, технологии обучения, технология программирования для обучения и всестороннего развития.
Скачать ОнЛайн материалы автора Максим Лапань, С. Белов, К. Синица на устройства FB2 EPUB TXT RTF PDF HTML MOBI форматы. Цена скачивания составляет 609.00 руб.