Применение методов интеллектуального анализа данных для изучения свойств суперкомпьютерных приложений
Шайхисламов Денис Ильгизович, Воеводин Вадим Владимирович
Научно-исследовательский вычислительный центр МГУ имени М.В. Ломоносова
Для эффективного использования ресурсов суперкомпьютера необходимо постоянно анализировать различные аспекты качества работы современных высокопроизводительных систем. Одним из наиболее важных аспектов является эффективность выполнения параллельных приложений, работающих на суперкомпьютере. А для того, чтобы изучать данный аспект, зачастую полезно иметь информацию о том, насколько различные приложения схожи между собой. Ранее нами были предложены два подхода к сравнению суперкомпьютерных приложений: на основе статической информации об исполняемых файлах, а также динамики их работы во время исполнения. В данной работе будут показаны два полезных на практике метода применения этих подходов: кластеризация заданий и предсказание метрик оценок качества использования суперкомпьютерных ресурсов. С помощью кластеризации будет показано, как можно выявлять аномальные группы запусков заданий, например, в рамках всего потока суперкомпьютерных приложений либо в рамках запусков одного пользователя. С помощью предсказания метрик оценок качества использования суперкомпьютерных ресурсов будет показано, как, минимизируя влияние на запускаемые приложения, собирать статистику по эффективности выполнения пользовательских приложений. Данные методы были успешно апробированы на суперкомпьютере петафлопсного уровня производительности Ломоносов-2.
высокопроизводительные вычисления, эффективность приложений, суперкомпьютерный центр, аномальные запуски, интеллектуальный анализ данных