ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ОПТИМІЗАЦІЇ ПАРАМЕТРІВ АНСАМБЛЮ МОДЕЛЕЙ ШТУЧНОГО ІНТЕЛЕКТУ ДЛЯ ПРОГНОЗУВАННЯ НАЯВНОСТІ ОПАДІВ ЗА ДАНИМИ МЕТЕОМОНІТОРИНГУ

Автор(и)

  • М. В. Дратований Вінницький національний технічний університет
  • О. М. Козачко Вінницький національний технічний університет
  • О. Л. Мельник Вінницький національний технічний університет
  • І. В. Варчук Вінницький національний технічний університет

DOI:

https://doi.org/10.31649/1997-9266-2020-153-6-76-83

Ключові слова:

інформаційна технологія, моделі штучного інтелекту, прогнозування наявності опадів, інформативні ознаки

Анотація

Прогнозування даних — це тривіальна задача системного аналізу, існують різні види прогнозів та передбачення. Одним з них є бінарний прогноз, який відповідає на питання: «Відбудеться подія чи ні?». Одним з питань метеорології є питання прогнозування наявності опадів, а також яка точність буде у такого прогнозу.

В роботі розглянуто задачу прогнозування наявності опадів за даними метеорологічного моніторингу та запропонована інформаційна технологія оптимізації параметрів ансамблю таких моделей машинного навчання, як моделі градієнтного бустингу та логістичної регресії, що побудовані на основі набору інформативних ознак. Запропонована інформаційна технологія дозволяє виконати розвідувальний аналіз вхідних даних та визначити оптимальний набір інформативних ознак, а за рахунок алгоритму, який на кожному кроці визначає оптимальні одно-, дво-, три-, … елементні набори ознак, максимізувати точність прогнозування. Побудовано графіки впливу ознак на точність використаних моделей машинного навчання. Для кожного типу моделей визначено свій набір ознак. Для побудови інформаційної технології взято дані, надані Вінницьким центром з гідрометеорології. Це дані моніторингу атмосфери м. Вінниця за останні 10 років, які включають: температуру повітря, вологість повітря, точку роси, хмарність та швидкість вітру.

Для підвищення точності прогнозування запропоновано математичну модель, яка базується на оптимальному визначенні ваг ансамблю моделей градієнтного бустингу та логістичної регресії. Проведено експерименти, які показали достатньо точний результат. Точність запропонованої інформаційної технології показала 80 %. Це підвередило достовірність запропонованої технології.

Біографії авторів

М. В. Дратований, Вінницький національний технічний університет

асистент кафедри системного аналізу та інформаційних технологій

О. М. Козачко, Вінницький національний технічний університет

канд. техн. наук, доцент, доцент кафедри системного аналізу та інформаційних технологій

О. Л. Мельник, Вінницький національний технічний університет

студентка факультету комп’ютерних систем і автоматики

І. В. Варчук , Вінницький національний технічний університет

канд. техн. наук, доцент, доцент кафедри системного аналізу та інформаційних технологій

Посилання

A. Bezerra, I. Silva, L. A. Guedes, D. Silva, G. Leitão, and K. Saito, “Extracting Value from Industrial Alarms and Events: A Data-Driven Approach Based on Exploratory Data Analysis,” Sensors, 2019, no. 19, issue 12, pp. 11-32.

Як роблять прогнози погоди і чому вони іноді не збуваються? Прогноз. [Електронний ресурс]. Режим доступу: https://www.bbc.com/ukrainian/features-51545290 . Назва з екрана.

Прогнози погоди і клімату та притаманні їм обмеження. [Електронний ресурс]. Режим доступу: http://prima.franko.lviv.ua/faculty/geology/phis_geo/fourman/E-books-FVV/Intera ctive%20books/Meteorology/Weather%20Forecasting/Weather%20Ukraine/Meteo-forecasting/Analyze-forecast%20of%20limits%20climate.htm . Назва з екрана.

Прогнозування погоди. [Електронний ресурс]. Режим доступу: http://prima.franko.lviv.ua/faculty/geology/phis_geo/fourman/E-books-FVV/Intera ctive%20books/Meteorology/ForecaseM.htm. Назва з екрана.

Guolin Ke, et. al.,“LightGBM: A Highly Efficient Gradient Boosting Decision Tree,” Advances in Neural Information Processing Systems 30 (NIPS 2017), pp. 3149-3157.

E. Bauer, and R. Kohavi, “An Empirical Comparison of Voting Classification Algorithms: Bagging, Boosting, and Variants,” Machine Learning, 1999, pp. 105-139.

Module pandas_profiling. [Electronic resource]. Available: https://pandas-profiling.github.io/pandas-profiling/docs/ .

Matplotlib API Overview. [Electronic resource]. Available: https://matplotlib.org/api/index.html .

A new correlation coefficient between categorical, ordinal and interval variables with Pearson characteristics. [Electronic resource]. Available: https://arxiv.org/abs/1811.11440 .

XGBoost Documentation. [Electronic resource]. Available: https://xgboost.readthedocs.io/en/latest/ .

LightGBM Documentation. [Electronic resource]. Available: https://lightgbm.readthedocs.io/en/latest/ .

##submission.downloads##

Переглядів анотації: 11

Опубліковано

2020-12-25

Як цитувати

[1]
М. В. . Дратований, О. М. Козачко, О. Л. . Мельник, і І. В. . Варчук, «ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ОПТИМІЗАЦІЇ ПАРАМЕТРІВ АНСАМБЛЮ МОДЕЛЕЙ ШТУЧНОГО ІНТЕЛЕКТУ ДЛЯ ПРОГНОЗУВАННЯ НАЯВНОСТІ ОПАДІВ ЗА ДАНИМИ МЕТЕОМОНІТОРИНГУ», Вісник ВПІ, вип. 6, с. 76–83, Груд 2020.

Номер

Розділ

Інформаційні технології та комп'ютерна техніка

Метрики

Завантаження

Дані завантаження ще не доступні.

Статті цього автора (авторів), які найбільше читають

1 2 > >>