Results for высокопроизводительные вычисления
-
Способы и средства динамической реконфигурации сетей суперкомпьютера при представлении пользовательских заданий в виде контейнеров
The article was published in issue №3
Одним из ключевых методов повышения эффективности использования вычислительных ресурсов является применение технологии контейнерной виртуализации. В отношении организации высокопроизводительных вычислений контейнерная виртуализация позволяет с минимальными накладными расходами решить проблему бинарной переносимости пользовательских заданий между различными суперкомпьютерными установками. Однако для возможности обработки представленных в виде контейнеров пользовательских заданий в системах коллективного пользования необходим механизм динамической реконфигурации сетей суперкомпьютера, осуществляемой перед каждым запуском задания. Статья посвящена поиску и выбору способов и средств, позволяющих осуществить динамическую реконфигурацию при запуске заданий в контейнерах Docker в суперкомпьютерных системах коллективного пользования.
-
Методы и средства совмещения потоков заданий от облачных платформ и менеджеров управления ресурсами суперкомпьютера
The article was published in issue №4
В статье рассмотрен подход к реализации облачного сервиса высокопроизводительных вычислений, обеспечивающий совмещение двух потоков суперкомпьютерных заданий: поступающего от облачной платформы и поступающего от менеджера управления ресурсами суперкомпьютера.
Авторами предложен метод совмещения потоков заданий, заключающийся в представлении менеджера управления ресурсами в виде гипервизора. Метод был реализован в Межведомственном суперкомпьютерном центре РАН для облачной платформы OpenStack, в качестве менеджера управления ресурсами суперкомпьютера выступила отечественная система управления прохождением параллельных заданий. Представление системы в виде гипервизора было осуществлено путем разработки драйвера для библиотеки libvirt, используемой платформой OpenStack для распределения виртуальных машин по доступным вычислительным ресурсам.
Рассмотренный в статье подход обеспечивает интеграцию существующей системы управления суперкомпьютером в стандартный стек ПО облачных вычислений и позволяет избежать больших накладных расходов на виртуализацию, а также сохранить традиционный порядок работы пользователей суперкомпьютерных центров при переходе к облачным вычислениям.
-
Methods and means of distributed storage systems implementation
The article was published in issue №3
One of key methods to increase the efficiency of computing resources utilization in supercomputer centers is to link them into a distributed network. For user jobs and data to be able to migrate in a supercomputer center network, there should be a distributed storage system providing a single file space for all centers.
The paper considers the existing methods and means of implementing distributed storage systems and analyzes their applicability to a supercomputer center network. It states the requirements to a distributed storage system for different aspects of its development and use: data and its metadata storage, user job life cycle support, and data security. Additionally, the paper defines possible options and techniques of implementing stated requirements into a distributed storage system of supercomputer center network.