МЕТОД СТРУКТУРНОГО АНАЛІЗУ ГЕТЕРОСКЕДАСТИЧНОГО ЧАСОВОГО РЯДУ З ВИКОРИСТАННЯМ БУСТИНГОВОЇ EGARCH МОДЕЛІ
Ключові слова:
часові ряди, аналіз даних, системний аналіз, гетероскедастична модель, бустинг, інтелектуальна модель, генеративний штучний інтелект, якість атмосферного повітряАнотація
Розроблено комплексний метод структурного аналізу гетероскедастичного часового ряду, який ґрунтується на поєднанні авторської бустингової моделі умовного середнього та EGARCH-моделі умовної дисперсії. Метод спрямований на кількісну локалізацію та формальну ідентифікацію прихованих динамічних режимів процесу, викликаних дією значних зовнішніх збурювальних факторів. Запропоновано індекс модельної складності, що визначає міру структурного ускладнення процесу та відображає необхідність внесення додаткових бустингових корекцій у прогноз. Метод містить й мультишкальний аналіз рівнів впливу збурень, аналіз залежності між умовним середнім та умовною дисперсією, а також кластеризацію векторів рішень дерев в ансамблі, що дає можливість виявляти різні закономірності та режими процесу без використання додаткових ознак. Зазначено, що метод може бути поширений і на інші види подібних моделей гетероскедастичних процесів, які будуть використані замість EGARCH-складової моделі.
Запропоновано алгоритм виділення інтервалів підвищеної волатильності та підвищеної структурної складності, а також – визначення їх статистичної значущості з використанням волатильнісних, ентропійних та економетричних метрик.
Продемонстровано практичне застосування методу на даних громадського моніторингу якості атмосферного повітря м. Вінниця за показником PM1. Отримані результати свідчать про високу точність прогнозу (коефіцієнт детермінації — 0,97) та дають змогу локалізувати короткочасні стохастичні збурення й тривалі структурні аномалії, що не ідентифікуються класичними моделями ARIMA, ARIMA-GARCH, Prophet, інтелектуальними багатофічерними моделями на основі результатів роботи методів Python-бібліотеки tsfresh чи інших методів формального генерування ознак. Узагальнений аналітичний висновок згенеровано автоматично з використанням великої мовної моделі. Доведено, що індекс структурної складності дозволяє виявляти аномалії у внутрішній структурі процесу, які не супроводжуються зростанням умовної дисперсії та відображають появу нових систематичних впливів або зміну динамічного механізму процесу.
Наведений приклад підтверджує ефективність методу для задач системного аналізу та створює основу для його подальшого застосування у системах підтримки прийняття рішень щодо оцінювання стану довкілля та стану інших складних систем.
Посилання
В. Є. Копняк, В. Б. Мокін, С. О. Жуков, І. В. Варчук, і Т. В. Скринник, «Метод бустингу гетероскедастичних моделей для прогнозування концентрацій пилу Сахари в атмосферному повітрі України,» Наукові праці Наукові праці Вінницького національного технічного університету, вип. 2, Лип. 2024. [Електронний ресурс]. https://doi.org/10.31649/2307-5376-2024-2-28-38 .
J. D. Hamilton, “A New Approach to the Economic Analysis of Nonstationary Time Series and the Business Cycle,” Econometrica, vol. 57, no. 2, pp. 357-384, Mar. 1989. https://doi.org/10.2307/1912559 .
В. Б. Мокін, А. В. Лосенко, і А. Р. Ящолт, «Інформаційна технологія аналізу та прогнозування кількості нових випадків захворювань на коронавірус SARS-CoV-2 в Україні на основі моделі Prophet,» Вісник Вінницького політехнічного інституту, № 5, с. 71-83, 2020. https://doi.org/10.31649/1997-9266-2020-152-5-71-83 .
G. E. P. Box, G. M. Jenkins, G. C. Reinsel, and G. M. Ljung, Time Series Analysis: Forecasting and Control, 5th ed. Hoboken, NJ, USA: John Wiley & Sons, 2015, 712 p. ISBN: 978-1-118-67502-1.
В. Б. Мокін, і М. В. Дратований, Наука про дані: машинне навчання та інтелектуальний аналіз даних, електр. навч. посіб. Вінниця, Україна: ВНТУ, 2024, 258 с. [Електронний ресурс]. Режим доступу: https://docs.vntu.edu.ua/card.php?id=8163.
J. Brownlee, “How to Model Volatility with ARCH and GARCH for Time Series Forecasting in Python,” Machine Learning Mastery, Aug. 24, 2018. [Electronic resource]. Available: https://machinelearningmastery.com/develop-arch-and-garch-models-for-time-series-forecasting-in-python .
M. Christ, N. Braun, J. Neuffer, and A. W. Kempa-Liehr, “Time Series FeatuRe Extraction on basis of Scalable Hypothesis tests (tsfresh – A Python package),” Neurocomputing, vol. 307, pp. 72-77, 2018. https://doi.org/10.1016/j.neucom.2018.03.067 .
A. Bhatnagar, P. Kassianik, C. Liu, et al., “Merlion: A Machine Learning Library for Time Series,” arXiv preprint, arXiv:2109.09265, 2021. https://doi.org/10.48550/arXiv.2109.09265 .
Q. P. Duy, et al., “Estimating and forecasting bitcoin daily prices using ARIMA-GARCH models,” Business Analyst Journal, vol. 45, no. 1, pp. 11-23, 2024. https://doi.org/10.1108/BAJ-05-2024-0027.
J. A. Mariño, M. E. Arrieta-Prieto, and S. A. Calderón, “Comparison between statistical models and machine learning for forecasting multivariate time series: An empirical approach,” Communications in Statistics: Case Studies, Data Analysis and Applications, vol. 11, no. 1, pp. 56-91, 2025. https://doi.org/10.1080/23737484.2025.2463905 .
J. Olbryś, and E. Majewska, “Regularity in stock market indices within turbulence periods: The sample entropy approach,” Entropy, vol. 24, no. 7, p. 921, 2022. https://doi.org/10.3390/e24070921 .
I. Chronopoulos, L. Giraitis, and G. Kapetanios, “Choosing between persistent and stationary volatility,” The Annals of Statistics, vol. 50, no. 6, pp. 3466-3483, Dec. 2022. https://doi.org/10.1214/22-AOS2236 .
G. Bardas, N. Kefalakis, and J. Soldatos, “Indicators of External Disruptions in Supply Chains: A Framework for Early Detection and Resilience Planning,” in 2025 21st International Conference on Distributed Computing in Smart Systems and the Internet of Things (DCOSS-IoT). Lucca, Italy, 2025, pp. 1064-1071. https://doi.org/10.1109/DCOSS-IoT65416.2025.00160 .
K. Shibano, R. Lin, and G. Mogi, “Volatility Reducing Effect by Introducing a Price Stabilization Agent on Cryptocurrencies Trading,” in Proceedings of the 2020 2nd International Conference on Blockchain Technology (ICBCT ’20). New York, NY, USA: ACM, 2020, pp. 85-89. https://doi.org/10.1145/3390566.3391679 .
V. Mokin, D. Shmundiak, and V. Kopniak, “Air Quality Monitoring from EcoCity,” Kaggle Dataset, May 2024. [Electronic resource]. Available: https://www.kaggle.com/datasets/vbmokin/air-quality-monitoring-from-ecocity .
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, згодні з такими умовами:
- Автори зберігають авторське право і надають журналу право першої публікації.
- Автори можуть укладати окремі, додаткові договірні угоди з неексклюзивного поширення опублікованої журналом версії статті (наприклад, розмістити її в інститутському репозиторії або опублікувати її в книзі), з визнанням її первісної публікації в цьому журналі.
- Авторам дозволяється і рекомендується розміщувати їхню роботу в Інтернеті (наприклад, в інституційних сховищах або на їхньому сайті) до і під час процесу подачі, оскільки це сприяє продуктивним обмінам, а також швидшому і ширшому цитуванню опублікованих робіт (див. вплив відкритого доступу).