Результаты для запроса: q-learning
-
Современные подходы к решению задачи стабилизации перевернутого маятника
Статья была опубликована в выпуске №2
В статье рассматривается задача стабилизации перевернутого маятника. Приводятся уравнения движения и способы решения задачи с помощью регуляторов. Подробно рассматриваются алгоритмы Random Search, Hill Climbing, Policy Gradient, Q-learning и возможность их использования в OpenAI Gym. Проводится сравнение алгоритмов, оценивается возможность их применения для решения других задач в рамках OpenAI Gym.