К навигации
К содержимому

Результаты для запроса: q-learning

Современные подходы к решению задачи стабилизации перевернутого маятника

С.А. Беляев Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», Санкт-Петербург, Россия, технических наук;
А.Г. Михнович Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина) (СПбГЭТУ «ЛЭТИ»), Санкт-Петербург, Россия;

Статья была опубликована в выпуске №2

В статье рассматривается задача стабилизации перевернутого маятника. Приводятся уравнения движения и способы решения задачи с помощью регуляторов. Подробно рассматриваются алгоритмы Random Search, Hill Climbing, Policy Gradient, Q-learning и возможность их использования в OpenAI Gym. Проводится сравнение алгоритмов, оценивается возможность их применения для решения других задач в рамках OpenAI Gym.