О программной реализации метода Монте-Карло для оценивания доверительных полос линейной регрессии
- Cтепанов Александр Владимирович, Всероссийский научно-исследовательский институт метрологии им. Д.И. Менделеева (ВНИИМ) (Санкт-Петербург, Россия)
Рассматривается задача расчета полос неопределенности линейной регрессии с коррелированными исходными данными. Для оценивания доверительных полос применяется обобщенный метод наименьших квадратов, при этом для оценивания их границ вводится коэффициент охвата, который, будучи умноженным на стандартную неопределенность регрессии в рассматриваемых точках, дает указанные границы. Актуальность исследования определяется тем, что стандартные методы построения доверительных интервалов, основанные на предположении о независимости ошибок, при наличии автокорреляции приводят к систематическому занижению ширины полос неопределенности. Это, в свою очередь, создает ложное впечатление о точности прогнозов и может служить причиной ошибочных статистических выводов. Для корректного построения доверительных полос необходимо учитывать структуру временной зависимости ошибок. В работе рассматриваются следующие модели коррелированных шумов: авторегрессионные процессы с экспоненциальным затуханием корреляции, а также цветные шумы, характеризующиеся степенным затуханием и долговременной памятью.
В отличие от классического случая независимых ошибок, где коэффициент охвата соответствует квантили нормального распределения, при наличии корреляции его аналитическое выражение отсутствует. Значение коэффициента напрямую зависит от структуры ковариационной матрицы ошибок, объема обучающей выборки и горизонта прогнозирования. Для его определения в работе применяется численный метод Монте-Карло в сочетании с итерационной процедурой бисекции, позволяющий находить коэффициент охвата с заданной точностью.
Разработано специализированное программное обеспечение на языке Python с использованием библиотек NumPy и SciPy. Программная реализация решает задачу оценивания полосы линейной регрессии гиперболической формы, когда корреляционная структура ошибок описывается вышеупомянутыми моделями. Приведены соответствующие примеры оценивания упомянутого коэффициента охвата и полос регрессии, дана ссылка на программную реализацию. Модульная архитектура разработанной программы допускает расширение на другие типы корреляционных структур. Применимость работы обусловлена необходимостью обеспечения корректной оценки неопределенности при статистической обработке экспериментальных данных, получаемых при решении измерительных задач.
линейная регрессия, доверительные полосы, обобщенный метод наименьших квадратов, коррелированный шум, цветной шум, метод Монте-Карло, численные методы
2026-03-05