Artificial Intelligence: Reinforcement Learning in Python

0/5 ·
Создан: 24 февраля 2017 г. Обновлён: 23 марта 2026 г.

Вам нужен инструмент для решения задач принятия решений, где агент обучается на основе проб и ошибок — именно это разбирается через алгоритмы обучения с подкреплением (Reinforcement Learning). Внутри курса вы пошагово пройдете путь от основ до реализации интеллектуальных агентов на языке Python. Вы узнаете, как работает Марковский процесс принятия решений, освоите методы динамического программирования и временных различий (TD), включая Q-Learning. Курс ориентирован на тех, кто хочет углубиться в машинное обучение и построение AI-систем, способных к автономному обучению в динамической среде.

Автор

Другие материалы школы

Машинное обучение с Python и Big Data Можно купить
200 ₽ 9 000 ₽ −98%

Машинное обучение с Python и Big Data

Udemy
И
Можно купить
250 ₽ 750 ₽ −67%

Изучим Scrapy на примерах

Udemy
Изучение английского языка по реальным диалогам Можно купить
138 ₽ 3 195 ₽ −96%
5.0

Изучение английского языка по реальным диалогам

Gabriel Silva
В
Можно купить
144 ₽ 850 ₽ −83%

Введение в технологию Блокчейн

Udemy
D
Можно купить
200 ₽ 800 ₽ −75%

Dependency Injection in C# and .NET with the Autofac Library

Dmitri Nesteruk
П
Можно купить
388 ₽

Полный курс по созданию ссылок. Создание обратных ссылок 2020

Джошуа Джордж
Прикладной биохакинг и саморазвитие Можно купить
136 ₽ 1 490 ₽ −91%
5.0

Прикладной биохакинг и саморазвитие

Мефодий Келевра
В
Можно купить
238 ₽ 899 ₽ −74%

Введение в MongoDB для анализа данных

Brian Dowe, Kirill Eremenko
А
Можно купить
238 ₽ 999 ₽ −76%

Арбитраж криптовалюты

Richard PO
DeepFakes и клонирование голоса: Машинное обучение простым способом Можно купить
140 ₽

DeepFakes и клонирование голоса: Машинное обучение простым способом

Lazy Programmer Inc.
0 · 0 отзывов

Отзывов пока нет. Будьте первым!

Ещё интересные курсы

B
Можно купить
272 ₽ 14 900 ₽ −98%

Big Data: основы работы с большими массивами данных

P
Можно купить
90 ₽ 700 ₽ −87%

Python для финансового и фондового рынка

Рекомендательные системы и Глубокое обучение на Python Можно купить
136 ₽ 700 ₽ −81%

Рекомендательные системы и Глубокое обучение на Python

Lazy Programmer
С
Можно купить
75 ₽ 1 490 ₽ −95%

Старт в аналитике

Нетология
Факультет искусственного интеллекта. Часть 6/6 Можно купить
790 ₽ 23 490 ₽ −97%

Факультет искусственного интеллекта. Часть 6/6

GeekBrains
О
Можно купить
460 ₽ 14 990 ₽ −97%

Основы решения алгоритмических задач. Уровень 2

Специалист
Вкалывают роботы, а не человек. Искусственный интеллект завтра Можно купить
700 ₽

Вкалывают роботы, а не человек. Искусственный интеллект завтра

Александр Фенин
VesperfinCode: MarketRaptor — Суперавтоматизация трейдинга Можно купить
206 ₽ 3 300 ₽ −94%

VesperfinCode: MarketRaptor — Суперавтоматизация трейдинга

Арина Веспер
Среда Python (программирование, основы и практика, нейронные сети, искусственный интеллект) (2025) Сбор взносов
3 374 ₽ 40 000 ₽ −92%

Среда Python (программирование, основы и практика, нейронные сети, искусственный интеллект) (2025)

ИПАП
Научитесь создавать и деплоить DL-сервисы за 4 месяца Сбор взносов
0 ₽

Научитесь создавать и деплоить DL-сервисы за 4 месяца

Денис Солдатов