Оценка параметров стохастических потоков событий методами машинного обучения

  • Салимзянова Дарья Дмитриевна, Томский государственный университет (Томск, Россия)
  • Лисовская Екатерина Юрьевна, Томский государственный университет (Томск, Россия)
  • Самойлов Сергей Антонович, Томский государственный университет (Томск, Россия)

Аннотация. В данной работе рассматривается задача оценки параметров стохастических потоков событий на основе выборочных данных с применением методов машинного обучения. Потоки событий, характеризуемые случайными интервалами между моментами их наступления, широко применяются в моделировании сетевого трафика, телекоммуникаций, вычислительных систем и в теории массового обслуживания. Точная оценка параметров таких потоков имеет ключевое значение для последующего анализа, прогнозирования и управления нагрузкой в системах с неопределённой входной информацией. В качестве исходных данных для обучения моделей были использованы моменты наступления событий в двух типах потоков: пуассоновский поток (интервалы между событиями подчиняются экспоненциальному распределению), рекуррентный поток, (интервалы между событиями следуют одной из двенадцати функций распределения вероятностей: гамма, гиперэкспоненциальное, логнормальное, равномерное, обратное гамма, распределение Вейбулла, Парето, Леви, Фишера, Фреше, Ломакса и Бура XII). Выбор этих распределений обусловлен их разнообразными статистическими свойствами (наличие/отсутствие моментов, асимметрия, тяжёлые хвосты), что позволяет охватить широкий спектр применимых сценариев. Для решения задачи оценки параметров были использованы полносвязные нейронные сети и алгоритм градиентного бустинга в реализации CatBoost. Входными данными для моделей были выбраны интервалы между моментами наступления событий и числовые характеристики этих интервалов: математическое ожидание, среднеквадратичное отклонение, дисперсия, коэффициент вариации, квантили различных уровней. Для оценки качества моделей применялись классические метрики машинного обучения: MAE, RMSE, R2 . Также в рамках исследования была проведена оценка важности признаков, участвующих в обучении моделей. Для этого использовались встроенные механизмы интерпретации градиентного бустинга, позволяющие количественно определить вклад каждого признака в оценку параметров.

идентификация трафика, сетевой трафик, оценка параметров, градиентный бустинг

2025-12-01

Вернуться назад