Статьи выпуска за Сентябрь 2019
Обнаружение выбросов методом голосования при проведении иерархической кластеризации данных
В настоящее время часто приходится сталкиваться с задачей извлечения полезной информации из большого объема исходных сырых данных. Этот процесс, получивший название Data Mining, объединяет в себе различные подходы к анализу и обработке данных, однако всегда начинается с одного конкретного этапа - очистки данных. Сырые данные, поступающие на вход для анализа, часто оказываются неполными, слабоструктурированными, содержат дублирующую информацию и аномалии. Наличие аномалий в массиве входных данных может привести к неверной трактовке извлекаемой информации, к ошибкам в предсказании и сильно снижает ценность получаемых знаний. Поэтому так актуальна задача разработки новых подходов к устранению аномалий, или выбросов.
В данной статье рассматривается подход к обнаружению выбросов, основанный на иерархической кластеризации данных и применении метода голосования для выявления наиболее вероятных кандидатов на роль выбросов.
Применение нечеткой меры достоверности для анализа технического состояния летательных аппаратов В условиях нестохастической неопределенности
В связи с повышением уровня сложности летательных аппаратов и ужесточением требований по оперативности контроля технического состояния остро стоит вопрос автоматизации решения задач анализа. Отдельные результаты были получены, например, при разработке унифицированных алгоритмов автоматизированного анализа телеметрической информации, поступающей с борта пилотируемых космических аппаратов. Основой алгоритмов явилась совокупность методов контроля, в частности, метода многоуровневого контроля, деревьев поиска состояний, матриц состояний и др. С их помощью удается выполнить оперативный анализ технического состояния большинства систем летательных аппаратов, однако существенным недостатком при этом является невозможность количественной оценки достоверности заключений о техническом состоянии систем.
Рекомендуемая ГОСТ 19919 – 74 вероятностная мера достоверности в практике управления летательными аппаратами применяется ограниченно из-за отсутствия достаточной статистики, а также ресурсных и временных ограничений. В связи с этим задача разработки методов контроля технического состояния летательных аппаратов, позволяющих получать оперативные заключения о техническом состоянии контролируемого объекта с количественной оценкой достоверности в условиях нестохастической неопределенности, является актуальной. Возможным вариантом ее решения является использование нечеткой меры достоверности.
Важной составляющей современной системы управления летательными аппаратами различного назначения является подсистема контроля технического состояния. При этом под контролем понимается процесс сбора и обработки информации с целью определения событий. В практике управления летательными аппаратами этап обработки измерительной информации с целью получения заключения о техническом состоянии объекта контроля рассматривается как анализ технического состояния.
В статье рассмотрены модификации известных методов автоматизированного анализа технического состояния бортовых систем летательных аппаратов различного назначения, основанные на применении нечеткой меры достоверности.
Методы и средства организации распределенных систем хранения данных
Одним из ключевых методов повышения эффективности использования вычислительных ресурсов суперкомпьютерных центров коллективного пользования (СКЦ) является их объединение в единую распределенную сеть. Для возможности миграции пользовательских заданий и данных в сети СКЦ должна быть предусмотрена распределенная система хранения данных (РСХД), обеспечивающая единое файловое пространство для всех центров. Работа авторов посвящена исследованию существующих методов и средств организации распределенных систем хранения данных и анализу их применимости для сети СКЦ. В статье сформулированы требования к РСХД для разных аспектов ее разработки и применения: организации хранения данных и их метаданных, поддержки жизненного цикла пользовательских заданий, обеспечения безопасности данных. Кроме этого, определены возможные варианты и средства реализации в создаваемой РСХД сети СКЦ сформулированных требований.