ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ АНАЛІЗУ ТА ПРОГНОЗУВАННЯ КІЛЬКОСТІ НОВИХ ВИПАДКІВ ЗАХВОРЮВАНЬ НА КОРОНАВІРУС SARS-COV-2 В УКРАЇНІ НА ОСНОВІ МОДЕЛІ PROPHET
DOI:
https://doi.org/10.31649/1997-9266-2020-152-5-71-83Ключові слова:
інформаційна технологія, SARS-CoV-2, COVID-19, прогнозування часових рядів, Prophet, штучний інтелектАнотація
Розроблено інформаційну технологію аналізу та прогнозування кількості нових підтверджених випадків захворювань на коронавірус «COVID-19», викликаних інфекцією SARS-CoV-2, на прикладі щодобових сумарних по Україні даних поточної «хвилі» з урахуванням різних свят і псевдосвят, які можуть мати аномальний вплив. Проведено огляд відомих моделей для врахування таких аномалій та обґрунтовано, що за сучасних коротких рядів даних спостережень та інших умов оптимальною для розв’язання цієї задачі є модель Facebook Prophet. Охарактеризовано наявні дані щодо можливих часових аномалій по Україні у відомому датасеті Google-платформи «COVID-19 Open Data» та запропоновано яким чином можна адаптивно враховувати такі аномалії, як: державні свята, дати, коли за даними NOAA було дуже тепло і не було опадів та дати послаблення карантину за інформацією з «Oxford COVID-19 government response tracker». Розроблено алгоритм застосування запропонованої інформаційної технології з двоетапною ідентифікацією параметрів та окремим валідаційним датасетом для ідентифікації оптимальної структури моделі на кожному з цих етапів. Створено програмне забезпечення на Python на базі платформи Kaggle, яке застосовано, як для України, так і ще для 69 країн світу. Для прискорення роботи, по-перше, розроблено спрощену версію моделі лише з одним етапом її ідентифікації, а по-друге, створено новий датасет «COVID-19: Holidays of countries» з інформацією про свята 70 країн світу, адаптований до потреб цієї технології та розміщений у Kaggle у форматі відкритих даних. За допомогою ідентифікованих моделей отримано низку важливих висновків щодо розуміння закономірностей поширення коронавірусу як в Україні, так і в інших 69 країнах світу. Побудовано модель, яка забезпечує моделювання кількості нових підтверджених випадків захворювань на коронавірус в Україні на 2 тижні вперед з похибкою 2,2 % та зроблено прогноз на наступні 2 тижні, який передано у Робочу групу з математичного моделювання проблем, пов’язаних з епідемією коронавірусу SARS-CoV-2 в Україні.
Посилання
І. Бровченко, «Розробка математичної моделі поширення епідемії COVID-19 в Україні,» Світогляд, № 2 (82), с. 2-14, 2020.
C. L. Althaus, (2020) Real-time modeling and projections of the COVID-19 epidemic in Switzerland, Institute of Social and Preventive Medicine, University of Bern, Switzerland 20 April 2020, [Electronic resource]. Available: https: ispmbern.github.io/covid-19/swiss-epidemic-model .
Прогноз розвитку епідемії COVID-19 в Україні на 6–13 листопада 2020 року («Прогноз РГ-27»). [Електронний ресурс]. Режим доступу: http://www.nas.gov.ua/UA/Messages/Pages/View.aspx?MessageID=7129 , дата звернення: лист., 6. 2020.
Прогноз розвитку епідемії COVID-19 в Україні на 13–20 листопада 2020 року («Прогноз РГ-28»). [Електронний ресурс]. Режим доступу: http://www.nas.gov.ua/UA/Messages/Pages/View.aspx?MessageID=7155 , дата звернення: лист., 14. 2020.
V. B. Mokin, Total Ranking of all participants of COVID19 Global Forecasting Challenges — версія ноутбука – 12.06.2020 р. [Електронний ресурс]. Режим доступу: https://www.kaggle.com/vbmokin/all-ranking-covid19-global-forecasting-challenges , дата звернення: червень, 12. 2020.
Dr. Shikha Gaur, “Global Forecasting of COVID-19 Using Arima Based FB-PROPHET,” International Journal of Engineering Applied Sciences and Technology, vol. 5, issue 2, pp. 463-467, 2020. ISSN No. 2455-2143.
Peipei Wanga, and Xinqi Zheng, “Prediction of Epidemic Trends in COVID-19 with Logistic Model and Machine Learning Technics,” Chaos, Solitons & Fractals, vol. 139, October 2020. [Electronic resource]. Available: https://doi.org/10.1016/j.chaos.2020.110058 .
M. Indhuja and P.P. Sindhuja, “Prediction of Covid-19 cases in India using prophet,” International Journal of Statistics and Applied Mathematics, no. 5(4), pp. 103-106, 2020.
В. Б. Мокін, О. В. Слободянюк, О. М. Давидюк, і Д. О. Шмундяк, «Інформаційна технологія пошуку можливих джерел підвищеного забруднення річки з використанням моделі Prophet,» Вісник Вінницького політехнічного інституту, № 4, с. 15-24, 2020. https://doi.org/10.31649/1997-9266-2020-151-4-15-24.
COVID in UA: Prophet with 4, 7d seasonality — версія ноутбука — 22.11.2020 р. [Електронний ресурс]. Режим доступу: https://www.kaggle.com/vbmokin/covid-in-ua-prophet-with-4-7d-seasonality/output?scriptVersionId=47484394, дата звернення: лист., 22. 2020.
COVID-19: Holidays of countries — версія датасета — 21.11.2020 р. [Електронний ресурс]. Режим доступу: https://www.kaggle.com/vbmokin/covid19-holidays-of-countries , дата звернення: лист., 21. 2020.
COVID-19 in 70 countries: daily Prophet forecast — версія ноутбука — 21.11.2020 р. [Електронний ресурс]. Режим доступу: https://www.kaggle.com/vbmokin/covid-19-in-70-countries-daily-prophet-forecast?scriptVersionId=47433942, дата звернення: лист., 21. 2020.
##submission.downloads##
-
PDF
Завантажень: 543
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, згодні з такими умовами:
- Автори зберігають авторське право і надають журналу право першої публікації.
- Автори можуть укладати окремі, додаткові договірні угоди з неексклюзивного поширення опублікованої журналом версії статті (наприклад, розмістити її в інститутському репозиторії або опублікувати її в книзі), з визнанням її первісної публікації в цьому журналі.
- Авторам дозволяється і рекомендується розміщувати їхню роботу в Інтернеті (наприклад, в інституційних сховищах або на їхньому сайті) до і під час процесу подачі, оскільки це сприяє продуктивним обмінам, а також швидшому і ширшому цитуванню опублікованих робіт (див. вплив відкритого доступу).