ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ПРИСКОРЕНОГО АНОТУВАННЯ МЕДИЧНИХ ЗОБРАЖЕНЬ В ЗАДАЧАХ СЕГМЕНТАЦІЇ НА ОСНОВІ МОДЕЛЕЙ ГЛИБОКОГО НАВЧАННЯ

О. В. Коменчук; О. Б. Мокін

doi:10.31649/1997-9266-2024-175-4-95-103

Автор(и)

О. В. Коменчук Вінницький національний технічний університет
О. Б. Мокін Вінницький національний технічний університет

DOI:

https://doi.org/10.31649/1997-9266-2024-175-4-95-103

Ключові слова:

інформаційна технологія, штучний інтелект, глибоке навчання, сегментація, анотування даних, псевдомаски, автоматичне валідування

Анотація

Проаналізовано інструменти для створення анотацій медичних зображень у задачах сегментації зображень. Проведено порівняння продуктивності відомих інструментів Supervisely, CVAT та Segments.ai із запропонованою у роботі інформаційною технологією, яка використовує модель Language Segment-Anything з релевантними текстовими підказками і механізмом автоматичного валідування на основі моделі класифікації EfficientNet-B2.

Основною метою дослідження було визначення оптимального підходу до автоматизації процесу анотування зображень для забезпечення максимальної швидкості зі збереженням експертної точності. Результати показали, що використання інструмента Supervisely дозволило скоротити час на первинну анотацію до 39,7 секунд, але вимагало додаткових 59,5 секунд на корегування масок. CVAT, зі своїми напівавтоматичними інструментами, забезпечував створення масок за 64,8 с, але потребував ще 85,1 с на корегування. У порівнянні з ними, Segments.ai вимагав повної ручної анотації, що тривала 130,2 с. Водночас, розроблена інформаційна технологія, яка використовує модель Language Segment-Anything з налаштованими під задачу текстовими підказками та додатковий механізм автоматичного валідування, значно знизила час на створення анотацій – до близько 29,6 с на зображення, а також знизила час на ручне корегування до 45,4 с.

Розроблена інформаційна технологія продемонструвала високу швидкість та точність у створенні псевдомасок, підтверджену експериментальними результатами. Основні переваги цього підходу полягають у зменшенні необхідності в ручному корегування та підвищенні ефективності процесу анотування медичних зображень.

Це дослідження вказує на значний потенціал застосування автоматизованих методів для прискорення анотування у сфері комп’ютерного зору, сприяючи покращенню швидкості виконання завдань аналізу медичних даних зі збереженням потрібної якості.

Біографії авторів

О. В. Коменчук, Вінницький національний технічний університет

аспірант кафедри системного аналізу та інформаційних технологій

О. Б. Мокін, Вінницький національний технічний університет

д-р техн. наук, професор, професор кафедри системного аналізу та інформаційних технологій

Посилання

M. Aljabri, M. AlAmir, and M. AlGhamdi, “Towards a better understanding of annotation tools for medical imaging: a survey,” Multimed Tools Appl 81, pp. 25877-25911, 2022. https://doi.org/10.1007/s11042-022-12100-1 .

“Language Segment-Anything,” GitHub. [Electronic resource]. Available: https://github.com/luca-medeiros/lang-segment-anything .

“Supervisely,” GitHub, [Electronic resource]. Available: https://github.com/supervisely/supervisely .

“CVAT,” GitHub. [Electronic resource]. Available: https://github.com/cvat-ai/cvat .

“Segments.ai,” GitHub. [Electronic resource]. Available: https://github.com/segments-ai/segments-ai .

“Segment Anything Model (SAM),” GitHub. [Electronic resource]. Available: https://github.com/facebookresearch/segment-anything .

“OpenCV: Open Source Computer Vision Library,” GitHub. [Electronic resource]. Available: https://github.com/opencv/opencv

M. Tan, and Q.V. Le, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” Proceedings of the 36th International Conference on Machine Learning, ICML 2019, Long Beach, 2019, pp. 6105-6114. [Electronic resource]. Available: https://arxiv.org/pdf/1905.11946 .

Malhotra Priyanka, Gupta Sheifali, Koundal Deepika, Zaguia Atef, and Enbeyle Wegayehu, “Deep Neural Networks for Medical Image Segmentation,” Journal of Healthcare Engineering, 2022, 9580991, 15 p., 2022. https://doi.org/10.1155/2022/9580991 .

“Pulmonary Chest X-Ray Defect Detection,” Kaggle, [Electronic resource]. Available: https://www.kaggle.com/datasets/nikhilpandey360/chest-xray-masks-and-labels/data .

F. van Beers, A. Lindström, E. Okafor and M. Wiering, “Deep Neural Networks with Intersection over Union Loss for Binary Image Segmentation,” in Proceedings of the 8th International Conference on Pattern Recognition Applications and Methods, vol. 1 ICPRAM, 2019, pp. 438-445. SciTePress. [Electronic resource]. Available: https://pure.rug.nl/ws/portalfiles/portal/87088047/ICPRAM_2019_35.pdf .

Feng Li, et. al, “Visual In-Context Prompting,” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2024, pp. 12861-12871. [Electronic resource]. Available: https://openaccess.thecvf.com/content/CVPR2024/papers/Li_Visual_In-Context_Prompting_CVPR_2024_paper.pdf .

О. В. Коменчук, і О. Б. Мокін, «Аналіз методів передоброблення панорамних стоматологічних рентгенівських знімків для задач сегментації зображень,» Вісник Вінницького політехнічного інституту, № 5, с. 41-49, 2023. https://doi.org/10.31649/1997-9266-2023-170-5-41-49 .

ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ПРИСКОРЕНОГО АНОТУВАННЯ МЕДИЧНИХ ЗОБРАЖЕНЬ В ЗАДАЧАХ СЕГМЕНТАЦІЇ НА ОСНОВІ МОДЕЛЕЙ ГЛИБОКОГО НАВЧАННЯ

Автор(и)

DOI:

Ключові слова:

Анотація

Біографії авторів

О. В. Коменчук, Вінницький національний технічний університет

О. Б. Мокін, Вінницький національний технічний університет

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Метрики

Завантаження

Ліцензія

Статті цього автора (авторів), які найбільше читають

Мова

Подати статтю

Інформація

Відвідування

Поточний номер