Эта книга – подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
После покупки предоставляется дополнительная возможность скачать книгу в формате epub.
Также имеется ФРАГМЕНТ ТЕКСТА для ознакомления!
Коротко о главном в электронной версии о информационной безопасности с идентификатором 64086481:
Максим Лапань, С. Белов, К. Синица работа на тему безопасности в информационном пространстве базы данных, интернет, информационная безопасность, программирование
Ниже приведены ТЕГИ, по которым можно посмотреть аналоги книг о безопасности в сети.
Скачать Глубокое обучение с подкреплением. AlphaGo и другие технологии (pdf+epub) ОнЛайн
Электронная книга Для профессионалов (Питер) в жанре базы данных, интернет, информационная безопасность, программирование web-технологии, библиотека программиста, технологии обучения, технология программирования для обучения и всестороннего развития.
Скачать ОнЛайн материалы автора Максим Лапань, С. Белов, К. Синица на устройства FB2 EPUB TXT RTF PDF HTML MOBI форматы. Цена скачивания составляет 609.00 руб.
Читать бесплатно отрывок из книги или купить полную электронную версию:
ЧИТАТЬ ФРАГМЕНТ КУПИТЬ КНИГУ за 609.00 руб.