МЕТОД ІДЕНТИФІКАЦІЇ ПАРАМЕТРІВ ГАРМОНІК ТА АНОМАЛІЙ ПЕРІОДИЧНОГО ЧАСОВОГО РЯДУ НА ОСНОВІ АДАПТИВНОЇ ДЕКОМПОЗИЦІЇ

Автор(и)

  • Д. О. Шмундяк Вінницький національний технічний університет
  • В. Б. Мокін Вінницький національний технічний університет

DOI:

https://doi.org/10.31649/1997-9266-2023-171-6-46-56

Ключові слова:

аналіз часових рядів, моделювання, машинне навчання, аномалії часових рядів, сезонність, гармоніки ряду Фур’є, якість атмосферного повітря, EcoCity

Анотація

Періодичні часові ряди зустрічаються в багатьох задачах — це і фінансові показники, і показники якості атмосферного повітря, і показники стану води тощо. Відповідно їхнє моделювання та аналіз закономірностей є актуальним і досить поширеним завданням для розуміння можливих тенденцій і змін для коректного та своєчасного реагування. Важливими параметрами періодичних часових рядів є параметри їхнього тренду, сезонних складових та аномалій. І якщо задача визначення тренду часового ряду має багато універсальних методів розв’язання, то ідентифікація одночасно параметрів різних видів сезонності та аномалій різної природи у різні часові проміжки є складною задачею, яка не має універсального розв’язання. Більшість таких розв’язків є специфічними для конкретної предметної області або демонструють не чітку адекватність та точність апроксимації.

Розроблено новий метод ідентифікації параметрів гармонік та аномалій періодичного часового ряду, який базується на адаптивній декомпозиції ряду. Зокрема, запропоновано здійснювати декомпозицію заданого часового ряду з періодом до половини від загальної кількості точок і будувати графік відношень амплітуд сезонної складової до амплітуд самого ряду — так званої «декомпозиційної кривої». А тоді, згладжувати цю криву і знаходити локальні максимуми, які пропонується вважати такими, що відповідають періоду можливих видів сезонності ряду. З урахуванням багаторічного досвіду використання моделі Facebook Prophet запропоновано низку співвідношень між періодом сезонності, порядком ряду Фур’є для її апроксимації та ступенем регуляризації, який варто враховувати. Для кожного виду сезонності у кожному періоді одним з відомих методів слід знаходити аномальні дані та перевіряти їхню статистичну значущість. Статистично значущі аномалії збирати в єдину множину з типовими параметрами. Запропоновано низку можливих варіантів структур таких моделей часового ряду. Наведено алгоритм методу та описано його основні складові.

Здійснено випробування запропонованого методу на Python на базі платформи Kaggle з використанням моделі Facebook Prophet на реальних даних спостережень за якістю атмосферного повітря, отриманих з однієї зі станцій мережі громадського моніторингу EcoCity у межах міжнародної програми «Чисте повітря для України». Випробування показали, що порівняно з моделлю з параметрами і видами сезонності за замовчуванням, запропонований метод дозволив покращити точність апроксимації оптимальної моделі за метрикою R2 у 1,7 рази, а за метрикою MSE — у 2 рази. Це підтвердило ефективність запропонованого методу.

Біографії авторів

Д. О. Шмундяк, Вінницький національний технічний університет

аспірант кафедри системного аналізу та інформаційних технологій

В. Б. Мокін, Вінницький національний технічний університет

 д-р техн. наук, професор, завідувач кафедри системного аналізу та інформаційних технологій

Посилання

Robert Shumway, and David Stoffer, Time Series Analysis and Its Applications With R Examples, 2011 https://doi.org/10.1007/978-1-4419-7865-3 .

Б. І. Мокін, О. Б. Мокін, і В. Б. Мокін, Методологія та організація наукових досліджень, підруч., 3-е вид., змін. та доп. Вінниця: ВНТУ, 2023, 230 с.

Terence C. Mills, ARMA Models for Stationary Time Series, Chapter 3, Terence C. Mills, Ed., Applied Time Series Analysis, Academic Press, 2019, pp. 31-56, ISBN 9780128131176. https://doi.org/10.1016/B978-0-12-813117-6.00003-X .

Sean J Taylor, and Benjamin Letham, “Forecasting at scale,” Peer J. Preprints, 5, 2017. https://doi.org/10.7287/peerj.preprints.3190v2 .

В. Б. Мокін, О. В. Слободянюк, О. М. Давидюк, і Д. О. Шмундяк, «Інформаційна технологія пошуку можливих джерел підвищеного забруднення річки з використанням моделі Prophet,» Вісник Вінницького політехнічного інституту, № 4, с. 15-24, 2020. https://doi.org/10.31649/1997-9266-2020-151-4-15-24 .

А. В. Лосенко, «Інформаційна технологія прогнозування часового ряду кількості хворих на коронавірус на основі моделі Facebook Prophet,» Вісник Вінницького політехнічного інституту, № 5, с. 50-59, 2023. https://doi.org/10.31649/1997-9266-2023-170-5-50-59 .

В. Б. Мокін, А. В. Лосенко, і А. Р. Ящолт, «Інформаційна технологія аналізу та прогнозування кількості нових випадків хвороби на коронавірус SARS-COV-2 в Україні на основі моделі Prophet», Вісник Вінницького політехнічного інституту, № 5, с. 71-83, 2020. https://doi.org/10.31649/1997-9266-2020-152-5-71-83 .

В. Б. Мокін, А. В. Лосенко, і А. Р. Ящолт, «Інформаційна технологія аналізу та прогнозування багатохвильової кількості нових випадків захворювань на коронавірус COVID-19 на основі моделі Prophet», Вісник Вінницького політехнічного інституту, № 6, с. 65-75, 2020. https://doi.org/10.31649/1997-9266-2020-153-6-65-75 .

Dmytro Shmundiak, and Vitalii Mokin, “Adaptive decomposition for harmonics and anomalies,” Kaggle Notebook. [Electronic resource]. Available: https://www.kaggle.com/code/dimashmundiak/adaptive-decomposition-for-harmonics-and-anomalies. Accessed: 20.12.2023.

Vitalii Mokin, and Arsen Losenko, “COVID-19 Ukraine daily cases – EDA,” Kaggle Notebook. [Electronic resource]. Available: https://www.kaggle.com/code/vbmokin/covid-19-ukraine-daily-cases-eda . Accessed: 12.10.2023.

V. Aggarwal, V. Gupta, P. Singh, K. Sharma, and N. Sharma, “Detection of Spatial Outlier by Using Improved Z-Score Test,” 2019 3rd International Conference on Trends in Electronics and Informatics (ICOEI), Tirunelveli, India, 2019, pp. 788-790. https://doi.org/10.1109/ICOEI.2019.8862582 .

H. P. Vinutha, B. Poornima, and B. M. Sagar, “Detection of Outliers Using Interquartile Range Technique from Intrusion Dataset,” S. Satapathy, J. Tavares, V. Bhateja, J. Mohanty, Ed. Information and Decision Sciences. Advances in Intelligent Systems and Computing, vol. 701, 2018, Springer, Singapore. https://doi.org/10.1007/978-981-10-7563-6_53 .

Julien Lesouple, Cédric Baudoin, Marc Spigai, and Jean-Yves Tourneret, “Generalized isolation forest for anomaly detection,” Pattern Recognition Letters, vol. 149, pp. 109-119, 2021. ISSN 0167-8655. https://doi.org/10.1016/j.patrec.2021.05.022 .

Salima Omar, Md Ngadi, Hamid Jebur, and Salima Benqdara, “Machine Learning Techniques for Anomaly Detection: An Overview,” International Journal of Computer Applications, vol. 79, no. 2, 2013. https://doi.org/10.5120/13715-1478 .

В. Б. Мокін, і А. В. Лосенко, «Інформаційна технологія короткострокового прогнозування кількості нових хворих на коронавірус на основі моделі Facebook Prophet. Інформаційно-комунікаційні технології для перемоги та відновлення,» у Колективна монографія за матеріалами ХХII Міжнародної науково-практичної конференції «Інформаційно-комунікаційні технології та сталий розвиток» (Київ, 14-15 листопада 2023 р.), С. О. Довгий. Ред. Київ, Україна: ТОВ «Видавництво «Юстон», 2023, с. 27-30.

R. F. Woolson, Wilcoxon Signed-Rank Test. In Wiley Encyclopedia of Clinical Trials, R. B. D'Agostino, L. Sullivan and J. Massaro, Ed., 2008. https://doi.org/10.1002/9780471462422.eoct979 .

P. E. McKnight, and J. Najab, “Mann-Whitney U Test,” In The Corsini Encyclopedia of Psychology , I. B. Weiner and W. E. Craighead, Ed., 2010. https://doi.org/10.1002/9780470479216.corpsy0524 .

Sklearn. API Reference. [Electronic resource]. Available: https://scikit-learn.org/stable/modules/classes.html . Accessed: 07.12.2023.

##submission.downloads##

Переглядів анотації: 148

Опубліковано

2023-12-27

Як цитувати

[1]
Д. О. . Шмундяк і В. Б. Мокін, «МЕТОД ІДЕНТИФІКАЦІЇ ПАРАМЕТРІВ ГАРМОНІК ТА АНОМАЛІЙ ПЕРІОДИЧНОГО ЧАСОВОГО РЯДУ НА ОСНОВІ АДАПТИВНОЇ ДЕКОМПОЗИЦІЇ», Вісник ВПІ, вип. 6, с. 46–56, Груд. 2023.

Номер

Розділ

Інформаційні технології та комп'ютерна техніка

Метрики

Завантаження

Дані завантаження ще не доступні.

Статті цього автора (авторів), які найбільше читають

1 2 3 4 5 6 7 > >>