Читать книгу Усиленное обучение онлайн

Предположим, у нас есть шахматная доска, и агент (шахматная программа или игрок) хочет предсказать, в какие состояния он может попасть после совершения определенного хода. В этом случае модель переходов определяет вероятности перехода между состояниями (расположениями фигур на доске) в результате выполнения определенного действия (хода фигурой).

Конец ознакомительного фрагмента.

Текст предоставлен ООО «Литрес».

Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

20 21 22 23 2425