ТЕХНОЛОГІЯ ПОБУДОВИ ЕКСПЕРТНОЇ ІНФОРМАЦІЙНОЇ ВЕБ-СИСТЕМИ ВИЯВЛЕННЯ ТА ВЕРИФІКАЦІЇ ПРІОРИТЕТНИХ ЕКОЛОГІЧНИХ ПРОБЛЕМ У МАСИВАХ ВОД БАСЕЙНУ РІЧКИ
DOI:
https://doi.org/10.31649/1997-9266-2021-154-1-77-87Ключові слова:
інформаційна веб-система, технології захисту водних ресурсів, експертні оцінки, нечіткі множини, екологічні проблеми, масив вод, ПУРБ, машинне навчання, класифікація текстових даних, технології опрацювання природної мови, NLP, BERTАнотація
Розглянуто питання збирання, верифікації та узагальнення великої кількості експертних оцінок про наявний стан вод, наявні екологічні проблеми та впливові фактори, які збільшують ризик недосягнення екологічних цілей кожним масивом вод під час розроблення програм заходів планів управління річкового басейну (ПУРБ), спрямованих на досягнення чи стабілізацію доброго екологічного стану води у масивах вод цього басейну. Задача ускладнюється великою кількістю таких масивів вод, оскільки зібрати достовірну інформацію про об’єкти, розташовані у кожному з них, вкрай важко. Розв’язати це питання дозволить створення веб-системи з картою масивів вод і залученням великої кількості експертів із місцевих жителів, небайдужих до проблем свого довкілля. Проте, тоді виникає проблема перевірки достовірності оцінок цих експертів, враховуючи їх різну кваліфікацію, досвід роботи, різне бачення цілей ПУРБ, та проблема як їх зіставляти, щоб визначити найвразливіші регіони за різними критеріями. Для цього запропоновано вимагати від експертів не просто експертні оцінки на основі єдиних довідників варіантів можливих відповідей, а й посилання на текстові веб-ресурси, які підтверджують їх оцінки. А потім аналізувати наскільки ці джерела дійсно підтверджують кожну оцін ку щодо відповідного типу проблеми для певного регіону. Авторами розглянуті різноманітні підходи для зіставлення експертних оцінок як на основі нечітких множин, так і за допомогою технологій машинного навчання та опрацювання природної мови (англ. — Natural Language Processing (NLP)). Розглянуто аналоги розроблювальної авторами системи.
Розроблено метод виявлення та верифікації пріоритетних екологічних проблем у масивах вод басейну річки за нечіткими експертними оцінками, з урахуванням ймовірностей того, що процитовані експертом текстові матеріали дійсно відповідають зазначеній проблемі. Ці ймовірності визначаються з використанням моделей NLP-технологій. Охарактеризовано етапи функціонування експертної інформаційної веб-системи для реалізації запропонованої технології, яка дозволить одночасно зібрати максимально достовірну і детальну інформацію про об’єкти масивів вод та прискорити її опрацювання і ранжування.
Наведено приклад реалізації інформаційної веб-системи виявлення пріоритетних екологічних проблем у масивах вод басейну річки Південний Буг. Наведено приклади обчислення достовірності експертних оцінок із застосуванням авторської програми на Python на основі NLP-моделі BERT і логістичної регресії до реальної текстової інформації.
Посилання
Кабінет Міністрів України, Постанова № 336 від 18.05.2017 року «Про затвердження Порядку розроблення плану управління річковим басейном». [Електронний ресурс]. Режим доступу: https://www.davr.gov.ua/postanova-kabinetu-ministriv-ukraini-vid-18-travnya-2017-roku--336-pro-zatverdzhennya-poryadku-rozroblennya-planu-upravlinnya-richkovim-basejnom .
The EU Water Framework Directive – integrated river basin management for Europe Directive 2000/60/ЕС establishing a framework for the Community action of water policy (Water Framework Directive).
Ю. І. Мітюшкін, Б. І. Мокін, і О. П. Ротштейн, Soft Computing: ідентифікація закономірностей нечіткими базами знань, моногр. Вінниця, Україна: УНІВЕРСУМ-Вінниця, 2002, 145 с. [Електронний ресурс]. Режим доступу: http://mokin.com.ua/files/articles/60/88/SoftComputing.pdf .
В. М. Дубовой, Р. Н. Квєтний, О. І. Михальов, і А. В. Усов, Моделювання та оптимізація систем, підруч. Вінниця, Україна: ПП «ТД«Едельвейс», 2017, 804 с.
Haining Ding, Xiaojian Hu, and Xiaoan Tang «Multiple-attribute group decision making for interval-valued intuitionistic fuzzy sets based on expert reliability and the evidential reasoning rule,» Neural Computing and Applications, vol. 32, pp. 5213-5234, 2020. [Electronic resource]. Available: https://link.springer.com/article/10.1007%2Fs00521-019-04016-z .
Jean-Valère Cossu, Emmanuel Ferreira, Killian Janod, Julien Gaillard, and Marc El-Bèze «NLP-Based Classifiers to Generalize Expert Assessments in E-Reputation,» in International Conference of the Cross-Language Evaluation Forum for European Languages, vol. 9283, pp. 340-351, 2015. [Electronic resource]. Available: https://link.springer.com/chapter/10.1007/978-3-319-24027-5_37 .
Matthew Matero, et al., «Suicide Risk Assessment with Multi-level Dual-Context Language and BERT,» Proceedings of the Sixth Workshop on Computational Linguistics and Clinical Psychology, pp. 39-44, 2019. [Electronic resource]. Available: https://www.aclweb.org/anthology/W19-3005.pdf .
Er. Samadhan, U. Birajdar, and V. A. Losarwar, «Mining opinion targets and opinion words from reviews using natural language processing (NLP) techniques,» Journal of Critical Reviews, vol. 8, pp. 1029-1036, 2020. [Electronic resource]. Available: http://www.jcreview.com/?mno=95186 .
В. Б. Мокін, «Ідентифікація параметрів малих річок на основі теорії нечітких множин по експертних оцінках та по їх геоінформаційній моделі,» Вісник ЖДТУ, c. 133-142, 2004.
В. Б. Мокін, «Новий підхід до ідентифікації параметрів малих річок за нечіткими експертними оцінками,» Вісник Вінницького політехнічного інституту, № 4, c. 34-41, 2005.
Scikit-learn 0.24.1. Machine Learning in Python. User Guide. [Electronic resource]. Available: https://scikit-learn.org/stable/user_guide.html .
V. Mokin, D. Pasichniuk, O. Radetskyi, and M. Horash, Kaggle Dataset NLP: Reports & News Classification. ENG & UKR Automatic Environmental Reports & News Classification, 2020. [Electronic resource]. Available: https://www.kaggle.com/vbmokin/nlp-reports-news-classification .
Афанасьєв С., та ін., План управління річковим басейном Південного Бугу: аналіз стану та першочергові заходи. Київ, Україна: ТОВ «НВП «Інтерсервіс», 2014, 188 с.
V. Mokin, A. Luchko, and O. Davidyuk, Kaggle. NLP for EN: BERT Predict_proba in Water Report, [Electronic resource]. Available: https://www.kaggle.com/vbmokin/nlp-for-en-bert-predict-proba-in-water-report?scriptVersionId=53779986 .
##submission.downloads##
-
PDF
Завантажень: 198
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, згодні з такими умовами:
- Автори зберігають авторське право і надають журналу право першої публікації.
- Автори можуть укладати окремі, додаткові договірні угоди з неексклюзивного поширення опублікованої журналом версії статті (наприклад, розмістити її в інститутському репозиторії або опублікувати її в книзі), з визнанням її первісної публікації в цьому журналі.
- Авторам дозволяється і рекомендується розміщувати їхню роботу в Інтернеті (наприклад, в інституційних сховищах або на їхньому сайті) до і під час процесу подачі, оскільки це сприяє продуктивним обмінам, а також швидшому і ширшому цитуванню опублікованих робіт (див. вплив відкритого доступу).