Software Journal:
Theory and Applications

Подать статью

Вход Регистрация

Результаты для запроса: обучение с подкреплением

  1. Современные подходы к решению задачи стабилизации перевернутого маятника

    С.А. Беляев Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», Санкт-Петербург, Россия, технических наук;
    А.Г. Михнович Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина) (СПбГЭТУ «ЛЭТИ»), Санкт-Петербург, Россия;

    Статья была опубликована в выпуске №2

    В статье рассматривается задача стабилизации перевернутого маятника. Приводятся уравнения движения и способы решения задачи с помощью регуляторов. Подробно рассматриваются алгоритмы Random Search, Hill Climbing, Policy Gradient, Q-learning и возможность их использования в OpenAI Gym. Проводится сравнение алгоритмов, оценивается возможность их применения для решения других задач в рамках OpenAI Gym.