Это руководство по обучению с подкреплением (Reinforcement Learning, RL) охватывает теоретические основы, практические применения и современные достижения этой области. В нем раскрывается определение RL, его исторический контекст и ключевые отличия от других методов машинного обучения. Примеры применения RL включают игры, робототехнику, финансовые рынки и управление ресурсами. Математические основы включают в себя марковские процессы принятия решений, состояния, действия, вознаграждения и стратегии, а также Беллмановские уравнения и итерации ценности. В книге подробно рассматриваются основные алгоритмы RL, такие как метод Монте-Карло, Q-Learning, SARSA, методы градиента стратегии, REINFORCE и Actor-Critic, а также модели на основе планирования и глубокого обучения с подкреплением (DQN, DDPG, A3C). Практическая часть включает использование OpenAI Gym и других средств, настройку и тестирование моделей, а также примеры кода на Python с использованием библиотек TensorFlow и PyTorch.
Вы можете скачивать бесплатно - Усиленное обучение без необходимости регистрации в различных форматах: epub (епаб), fb2 (фб2), mobi (моби), pdf (пдф) на вашем мобильном телефоне. Теперь знакомство с интеллектуальными произведениями стало легким и увлекательным благодаря нашей библиотеке. Приятного чтения!