ІНТЕЛЕКТУАЛЬНА ТЕХНОЛОГІЯ ВИДОБУВАННЯ ТА ВЕРИФІКАЦІЇ ЧИСЛОВИХ ТА ТЕКСТОВИХ ДАНИХ У БАГАТОЗВ’ЯЗНИХ БАГАТОСТАДІЙНИХ ГЕОІНФОРМАЦІЙНИХ СИСТЕМАХ
Ключові слова:
штучний інтелект, база знань, модель, інформаційна система, датасет, моніторинг, водні ресурси, екосистемаАнотація
Запропоновано вирішення проблеми підвищення обсягів та рівня достовірності інформації про стан елементів багатозв’язних багатостадійних геоінформаційних систем (БГІС) з використанням інформаційних та інтелектуальних технологій, що особливо актуально для моніторингу стану цих об’єктів. Для розв’язання задачі використано числові та текстові дані з різних джерел (звіти, кадастри, публікації у ЗМІ та у соціальних мережах тощо), які прив’язані та верифіковані до елементів багатостадійних геоінформаційних систем з урахуванням просторово-часових метаданих. Застосовано критерій топологічної спостережуваності як міри повноти знань для верифікації числових даних у текстах.
Вперше запропоновано метод верифікації числових даних у текстах з використанням бази знань, повнота якої оцінується за допомогою критерію топологічної спостережуваності, що дає можливість оцінити повноту та точність видобутої інформації. Удосконалено метод формування користувацьких запитів до великої мовної моделі та RAG-архітектури шляхом прив’язки ембедингів до просторових об’єктів і часових меж, що уможливлює точніше знайти релевантну для користувача інформацію з урахуванням встановлених просторово-часових обмежень. Набув подальшого розвитку метод геоприв’язки, який автоматично відбирає релевантні факти у текстах і точніше зіставляє ці факти з описами масивів вод. Запропоновано інтегровану технологію, що поєднує ці методи — автоматизоване видобування числових і текстових фактів з різних джерел, їх просторово‑часову прив’язку до елементів ГІС та формалізовану верифікацію з метою зменшення інформаційної невизначеності та підвищення якості цифрових двійників для підтримки рішень.
Наведено приклад застосування цієї технології на прикладі задачі аналізу стану масиву вод басейну річки Південний Буг. Дослідження показало, що індекс достовірності новин про забруднення вод може бути збільшений від 0,3 до близько 0,99, тобто у 3,3 рази.
Посилання
В. Б. Мокін, І. В. Варчук, і Є. М. Крижановський, Інформаційна технологія аналізу та оптимізації топологічної спостережуваності багатозв’язних геоінформаційних систем, моногр. Вінниця, Україна: ВНТУ, 2019, 121 с. ISBN 978-966-641-765-0.
В. Б. Мокін, В. Г. Сторчак, Є. М. Крижановський, О. В. Гавенко, і В. Ю. Балачук. Інформаційні технології автоматизації обробки параметрів геоінформаційних систем з геометричними мережами, моногр. Вінниця: ВНТУ, 2014, 196 с. ISBN: 978-966-641-946-3.
Zeiler Michael, Modeling our World, ESRI: Redlands, USA, 1999, 202 p.
National Hydro Network. User Guide Series. Creating a Geometric Network in ArcGIS using NHN Data. Edition 1.0.
Комп’ютеризовані регіональні системи державного моніторингу поверхневих вод: моделі, алгоритми, програми, моногр., В. Б. Мокін, Ред. Вінниця, Україна: вид-во ВНТУ “Універсум–Вінниця”, 2005, 315 с.
«Водний Кодекс України,» Відомості Верховної Ради (ВВР), 1995, № 24, ст. 189, введений в дію Постановою ВР № 214/95-ВР від 06.06.95) [Електронний ресурс]. Режим доступу: http://zakon2.rada.gov.ua/laws/show/213/95-%D0%B2%D1%80 .
Водна стратегія України на період до 2050 року. Розпорядженням Кабінету Міністрів України від 9 грудня 2022 р. № 1134-р. [Електронний ресурс]. Режим доступу: https://zakon.rada.gov.ua/laws/show/1134-2022-%D1%80#Text .
Водна Рамкова Директива ЄС 2000/60/ЄС. Основні терміни та їх визначення. Київ, 2006. 240 с.
Розпорядження Кабінету Міністрів України від 1 листопада 2024 р. № 1078-р «Про затвердження планів управління річковими басейнами Вісли, Дністра та Південного Бугу на 2025—2030 роки.» https://zakon.rada.gov.ua/laws/show/1078-2024-%D1%80#Text .
В. Б. Мокін, і М. В. Дратований, Наука про дані: машинне навчання та інтелектуальний аналіз даних, електр. навч. посіб. комбінованого (локального та мережевого) використання. Вінниця, Україна: ВНТУ, 2024, 258 с. [Електронний ресурс]. Режим доступу: https://docs.vntu.edu.ua/card.php?id=8163 .
В. Б. Мокін, К. О. Бондалєтов, І. М. Штельмах, О. В. Слободянюк, «Автоматичне видобування знань з екологічних звітів з прив’язкою до часу та до просторових координат масивів вод,» Вісник Вінницького політехнічного інституту, вип. 3, с. 101-110, Черв. 2025, https://doi.org/10.31649/1997-9266-2025-180-3-101-110 .
Vitalii B. Mokin, et al., “Information measuring systems with mobile devices for identification of air pollution parameters caused by transport,” Proc. SPIE 10031, Photonics Applications in Astronomy, Communications, Industry, and High-Energy Physics Experiments, 2016, 1003128 (September 28, 2016), https://doi.org/10.1117/12.2249202 .
Vitalii Mokin, Іlona Varchuk, Kostiantyn Bondaletov, and Olena Slobodianiuk, “Method for Analyzing and Optimizing the Topologic Observability of Cognitive Maps of Complex Spatially Distributed Systems,”in Conference Proceedings 2017 IEEE First Ukraine Conference on Electrical and Computer Engineering (Ukrcon) May 29 – June 2, 2017 Kyiv, pp. 865-869. https://doi.org/10.1109/UKRCON.2017.8100371 .
В. Б. Мокін, К. О. Бондалєтов, Г. В. Горячев, і Д. Ю. Дзюняк, «Універсальна інформаційно-вимірювальна система оперативного екологічного моніторингу з використанням мобільних пристроїв,» Вісник Вінницького політехнічного інституту, № 5 (122), с. 116-122, 2015.
В. Б. Мокін, Д. Ю Дзюняк, К. О. Бондалєтов, і В. В. Олійник, «Метод і технологія моніторингу стану атмосферного повітря за допомогою універсальної інформаційно-вимірювальної системи з використанням мобільних пристроїв,» Наукові праці Вінницького національного технічного університету, № 4, 2015. [Електронний ресурс]. Режим доступу: http://praci.vntu.edu.ua/index.php/praci/article/view/456/454 .
A. Halterman, “Mordecai 3: A Neural Geoparser»,” arXiv, 2023, [Electronic resource]. Available: https://arxiv.org/pdf/2303.13675 .
Hanwen Zheng, et al., “A Comprehensive Survey on Document-Level Information Extraction,” in Proceedings of the Workshop on the Future of Event Detection (FuturED), 2024, pp. 58-72, USA: Association for Computational Linguistics, [Electronic resource]. Available: https://aclanthology.org/2024.futured-1.6.pdf .
J. Dagdelen, et al., “Structured information extraction from scientific text with large language models,” Nature Commun, no. 15, 1418, 2024. https://doi.org/10.1038/s41467-024-45563-x .
D. Dessí, et al., “CS-KG 2.0: A Large-scale Knowledge Graph of Computer Science,” Scientific Data, no. 12, 964, 2025. https://doi.org/10.1038/s41597-025-05200-8 .
Haoran Luo, et al., “Text2NKG: Fine-Grained N-ary Relation Extraction for N-ary relational Knowledge Graph Construction,” Advances in Neural Information Processing Systems 37 (NeurIPS), 2024. [Electronic resource]. Available: https://proceedings.neurips.cc/paper_files/paper/2024/hash/Abstract-Conference.html . Accessed: 06.06.2025.
R. Bommasani, et al. “On the Opportunities and Risks of Foundation Models,”Computer Science, Machine Learning, 2021. [Electronic resource]. Available: https://arxiv.org/abs/2108.07258 .
Vitalii Mokin, Іlona Varchuk, Kostiantyn Bondaletov, and Olena Slobodianiuk, “Method for Analyzing and Optimizing the Topologic Observability of Cognitive Maps of Complex Spatially Distributed Systems,” Conference Proceedings 2017 IEEE First Ukraine Conference on ELECTRICAL AND COMPUTER ENGINEERING (UKRCON) May 29 – June 2, 2017 Kyiv. pp. 865-869. https://doi.org/10.1109/UKRCON.2017.8100371 .
K. Bondalietov, and V. Mokin, “Notation System for Comparing and Synthesis of Intelligent Key Phrase Extraction Methods for Ontological Models in Information Systems,” in Information and Communication Technologies and Sustainable Development. ICT&SD 2022, S. Dovgyi, O. Trofymchuk, V. Ustimenko, L Globa,. Eds., Lecture Notes in Networks and Systems, vol. 809. Springer, Cham, 2023. https://doi.org/10.1007/978-3-031-46880-3_11 .
В. Б. Мокін, К. О. Бондалєтов, Є. М. Крижановський, і В. О. Караваєв, «Метод аугментації текстів про стан масивів вод на основі інтелектуальної прив’язки до багатозв’язних геоінформаційних систем іменованих сутностей,» Вісник Вінницького політехнічного інституту, № 3, с. 55-65, Черв. 2023. https://doi.org/10.31649/1997-9266-2023-168-3-55-65 .
К О. Бондалєтов, В. Б. Мокін, Є. М. Крижановський, і В.О. Караваєв, «Розроблення інтелектуальної веб-системи з інформацією про екологічні проблеми та природоохоронні заходи у масивах вод басейну р. Південний Буг WISEST-SBB,» Актуальні проблеми та перспективи розвитку фундаментальних, прикладних, загальнотехнічних та безпекових наук, в Матеріали IV всеукр. науково-практ. конф. пам’яті акад. Акад. наук вищ. освіти, проф. А. В. Касперського, Київ, 27 черв. 2024, с. 6-12. https://kztdop.ipf.npu.edu.ua/?view=article&id=244 .
A. Gelman, J. B. Carlin, H. S. Stern, D. B. Dunson, A. Vehtari, and D. B. Rubin, Bayesian Data Analysis, Third Edition, 2013.[Electronic resource]. Available: https://sites.stat.columbia.edu/gelman/book/ .
Vinbazar, «Біля Ладижина у Південному Бузі загинуло риби на 270 тисяч гривень,» Всі Новини Вінниці. Vinbazar.com. [Електронний ресурс]. Режим доступу: https://vinbazar.com/news/podiyi/bilya-ladijina-u-pivdennomu-buzi-zaginulo-ribi-na-270tisyach-griven .
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, згодні з такими умовами:
- Автори зберігають авторське право і надають журналу право першої публікації.
- Автори можуть укладати окремі, додаткові договірні угоди з неексклюзивного поширення опублікованої журналом версії статті (наприклад, розмістити її в інститутському репозиторії або опублікувати її в книзі), з визнанням її первісної публікації в цьому журналі.
- Авторам дозволяється і рекомендується розміщувати їхню роботу в Інтернеті (наприклад, в інституційних сховищах або на їхньому сайті) до і під час процесу подачі, оскільки це сприяє продуктивним обмінам, а також швидшому і ширшому цитуванню опублікованих робіт (див. вплив відкритого доступу).