МЕТОД ІДЕНТИФІКАЦІЇ ПАРАМЕТРІВ ГАРМОНІК ТА АНОМАЛІЙ ПЕРІОДИЧНОГО ЧАСОВОГО РЯДУ НА ОСНОВІ АДАПТИВНОЇ ДЕКОМПОЗИЦІЇ
DOI:
https://doi.org/10.31649/1997-9266-2023-171-6-46-56Ключові слова:
аналіз часових рядів, моделювання, машинне навчання, аномалії часових рядів, сезонність, гармоніки ряду Фур’є, якість атмосферного повітря, EcoCityАнотація
Періодичні часові ряди зустрічаються в багатьох задачах — це і фінансові показники, і показники якості атмосферного повітря, і показники стану води тощо. Відповідно їхнє моделювання та аналіз закономірностей є актуальним і досить поширеним завданням для розуміння можливих тенденцій і змін для коректного та своєчасного реагування. Важливими параметрами періодичних часових рядів є параметри їхнього тренду, сезонних складових та аномалій. І якщо задача визначення тренду часового ряду має багато універсальних методів розв’язання, то ідентифікація одночасно параметрів різних видів сезонності та аномалій різної природи у різні часові проміжки є складною задачею, яка не має універсального розв’язання. Більшість таких розв’язків є специфічними для конкретної предметної області або демонструють не чітку адекватність та точність апроксимації.
Розроблено новий метод ідентифікації параметрів гармонік та аномалій періодичного часового ряду, який базується на адаптивній декомпозиції ряду. Зокрема, запропоновано здійснювати декомпозицію заданого часового ряду з періодом до половини від загальної кількості точок і будувати графік відношень амплітуд сезонної складової до амплітуд самого ряду — так званої «декомпозиційної кривої». А тоді, згладжувати цю криву і знаходити локальні максимуми, які пропонується вважати такими, що відповідають періоду можливих видів сезонності ряду. З урахуванням багаторічного досвіду використання моделі Facebook Prophet запропоновано низку співвідношень між періодом сезонності, порядком ряду Фур’є для її апроксимації та ступенем регуляризації, який варто враховувати. Для кожного виду сезонності у кожному періоді одним з відомих методів слід знаходити аномальні дані та перевіряти їхню статистичну значущість. Статистично значущі аномалії збирати в єдину множину з типовими параметрами. Запропоновано низку можливих варіантів структур таких моделей часового ряду. Наведено алгоритм методу та описано його основні складові.
Здійснено випробування запропонованого методу на Python на базі платформи Kaggle з використанням моделі Facebook Prophet на реальних даних спостережень за якістю атмосферного повітря, отриманих з однієї зі станцій мережі громадського моніторингу EcoCity у межах міжнародної програми «Чисте повітря для України». Випробування показали, що порівняно з моделлю з параметрами і видами сезонності за замовчуванням, запропонований метод дозволив покращити точність апроксимації оптимальної моделі за метрикою R2 у 1,7 рази, а за метрикою MSE — у 2 рази. Це підтвердило ефективність запропонованого методу.
Посилання
Robert Shumway, and David Stoffer, Time Series Analysis and Its Applications With R Examples, 2011 https://doi.org/10.1007/978-1-4419-7865-3 .
Б. І. Мокін, О. Б. Мокін, і В. Б. Мокін, Методологія та організація наукових досліджень, підруч., 3-е вид., змін. та доп. Вінниця: ВНТУ, 2023, 230 с.
Terence C. Mills, ARMA Models for Stationary Time Series, Chapter 3, Terence C. Mills, Ed., Applied Time Series Analysis, Academic Press, 2019, pp. 31-56, ISBN 9780128131176. https://doi.org/10.1016/B978-0-12-813117-6.00003-X .
Sean J Taylor, and Benjamin Letham, “Forecasting at scale,” Peer J. Preprints, 5, 2017. https://doi.org/10.7287/peerj.preprints.3190v2 .
В. Б. Мокін, О. В. Слободянюк, О. М. Давидюк, і Д. О. Шмундяк, «Інформаційна технологія пошуку можливих джерел підвищеного забруднення річки з використанням моделі Prophet,» Вісник Вінницького політехнічного інституту, № 4, с. 15-24, 2020. https://doi.org/10.31649/1997-9266-2020-151-4-15-24 .
А. В. Лосенко, «Інформаційна технологія прогнозування часового ряду кількості хворих на коронавірус на основі моделі Facebook Prophet,» Вісник Вінницького політехнічного інституту, № 5, с. 50-59, 2023. https://doi.org/10.31649/1997-9266-2023-170-5-50-59 .
В. Б. Мокін, А. В. Лосенко, і А. Р. Ящолт, «Інформаційна технологія аналізу та прогнозування кількості нових випадків хвороби на коронавірус SARS-COV-2 в Україні на основі моделі Prophet», Вісник Вінницького політехнічного інституту, № 5, с. 71-83, 2020. https://doi.org/10.31649/1997-9266-2020-152-5-71-83 .
В. Б. Мокін, А. В. Лосенко, і А. Р. Ящолт, «Інформаційна технологія аналізу та прогнозування багатохвильової кількості нових випадків захворювань на коронавірус COVID-19 на основі моделі Prophet», Вісник Вінницького політехнічного інституту, № 6, с. 65-75, 2020. https://doi.org/10.31649/1997-9266-2020-153-6-65-75 .
Dmytro Shmundiak, and Vitalii Mokin, “Adaptive decomposition for harmonics and anomalies,” Kaggle Notebook. [Electronic resource]. Available: https://www.kaggle.com/code/dimashmundiak/adaptive-decomposition-for-harmonics-and-anomalies. Accessed: 20.12.2023.
Vitalii Mokin, and Arsen Losenko, “COVID-19 Ukraine daily cases – EDA,” Kaggle Notebook. [Electronic resource]. Available: https://www.kaggle.com/code/vbmokin/covid-19-ukraine-daily-cases-eda . Accessed: 12.10.2023.
V. Aggarwal, V. Gupta, P. Singh, K. Sharma, and N. Sharma, “Detection of Spatial Outlier by Using Improved Z-Score Test,” 2019 3rd International Conference on Trends in Electronics and Informatics (ICOEI), Tirunelveli, India, 2019, pp. 788-790. https://doi.org/10.1109/ICOEI.2019.8862582 .
H. P. Vinutha, B. Poornima, and B. M. Sagar, “Detection of Outliers Using Interquartile Range Technique from Intrusion Dataset,” S. Satapathy, J. Tavares, V. Bhateja, J. Mohanty, Ed. Information and Decision Sciences. Advances in Intelligent Systems and Computing, vol. 701, 2018, Springer, Singapore. https://doi.org/10.1007/978-981-10-7563-6_53 .
Julien Lesouple, Cédric Baudoin, Marc Spigai, and Jean-Yves Tourneret, “Generalized isolation forest for anomaly detection,” Pattern Recognition Letters, vol. 149, pp. 109-119, 2021. ISSN 0167-8655. https://doi.org/10.1016/j.patrec.2021.05.022 .
Salima Omar, Md Ngadi, Hamid Jebur, and Salima Benqdara, “Machine Learning Techniques for Anomaly Detection: An Overview,” International Journal of Computer Applications, vol. 79, no. 2, 2013. https://doi.org/10.5120/13715-1478 .
В. Б. Мокін, і А. В. Лосенко, «Інформаційна технологія короткострокового прогнозування кількості нових хворих на коронавірус на основі моделі Facebook Prophet. Інформаційно-комунікаційні технології для перемоги та відновлення,» у Колективна монографія за матеріалами ХХII Міжнародної науково-практичної конференції «Інформаційно-комунікаційні технології та сталий розвиток» (Київ, 14-15 листопада 2023 р.), С. О. Довгий. Ред. Київ, Україна: ТОВ «Видавництво «Юстон», 2023, с. 27-30.
R. F. Woolson, Wilcoxon Signed-Rank Test. In Wiley Encyclopedia of Clinical Trials, R. B. D'Agostino, L. Sullivan and J. Massaro, Ed., 2008. https://doi.org/10.1002/9780471462422.eoct979 .
P. E. McKnight, and J. Najab, “Mann-Whitney U Test,” In The Corsini Encyclopedia of Psychology , I. B. Weiner and W. E. Craighead, Ed., 2010. https://doi.org/10.1002/9780470479216.corpsy0524 .
Sklearn. API Reference. [Electronic resource]. Available: https://scikit-learn.org/stable/modules/classes.html . Accessed: 07.12.2023.
##submission.downloads##
-
pdf
Завантажень: 112
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, згодні з такими умовами:
- Автори зберігають авторське право і надають журналу право першої публікації.
- Автори можуть укладати окремі, додаткові договірні угоди з неексклюзивного поширення опублікованої журналом версії статті (наприклад, розмістити її в інститутському репозиторії або опублікувати її в книзі), з визнанням її первісної публікації в цьому журналі.
- Авторам дозволяється і рекомендується розміщувати їхню роботу в Інтернеті (наприклад, в інституційних сховищах або на їхньому сайті) до і під час процесу подачі, оскільки це сприяє продуктивним обмінам, а також швидшому і ширшому цитуванню опублікованих робіт (див. вплив відкритого доступу).