Глубокое обучение с подкреплением. AlphaGo и другие технологии

Meld me wanneer het boek is toegevoegd

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге — Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. — Изучите основу RL: марковские процессы принятия решений. — Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. — Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. — Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. — Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. — Реализуете метод AlphaGo Zero для игры в Connect4. — Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Dit boek is momenteel niet beschikbaar

944 afgedrukte pagina’s

Gerelateerde boekenAlle

Citaten

niodeyaciteerde uit3 jaar geleden
Движущими силами процесса обучения являются значение вознаграждения и наблюдения, почерпнутые из среды
- Leuk vinden
- Opmerking
- Delen
  Facebook
  Twitter
  Koppeling kopiëren
- Melden

Op de boekenplanken

anastasiiasklyar
To read
- 52
- 1
Niet langer volgen
Anna Prachuk
Program&Design
- 32
- 1
Niet langer volgen
Андрей
1
- 101
Niet langer volgen
Kirill Kruglikov
Data science
- 15
Niet langer volgen
Evgeny Maksimenko
Mathematics
- 2
Niet langer volgen