АЛГОРИТМ ВИЗНАЧЕННЯ СХОЖОСТІ ТЕКСТІВ НОВИН НА ОСНОВІ ПОЛІНОМІАЛЬНОГО ХЕШУВАННЯ

  • М. О. Гранік Вінницький національний технічний університет
  • В. І. Месюра Вінницький національний технічний університет
Ключові слова: новини, порівняння новин, поліноміальне хешування

Анотація

Запропоновано алгоритм порівняння текстів новин на основі поліноміального хешування. Алгоритм може бути використаний для кластеризації текстів новин. 

Біографії авторів

М. О. Гранік, Вінницький національний технічний університет
аспірант кафедри комп’ютерних наук
В. І. Месюра, Вінницький національний технічний університет
канд. техн. наук, доцент, професор кафедри комп’ютерних наук

Посилання

1. Singhal Amit. Modern Information Retrieval: A Brief Overview / Singhal Amit // Bulletin of the IEEE Computer Society Technical Committee on Data Engineering. — 2001. — 24 (4). — P. 35—43.
2. Матеріали курсу Data Mining, що викладався у University of Utah [Електронний ресурс]. — Режим доступу до ма-теріалів : http://www.cs.utah.edu/~jeffp/teaching/cs5955/L4-Jaccard+Shingle.pdf .
3. Karen Spärck Jones. A statistical interpretation of term specificity and its application in retrieval / Karen Spärck Jones // Journal of Documentation. — 2004. — No. 60. — P. 493—502.
4. Lovins Julie Beth. Development of a Stemming Algorithm / Lovins Julie Beth // Mechanical Translation and Computational Linguistics. — 2006. — No. 11. — P. 22—31.
5. All About Stop Words for Text Mining and Information Retrieval [Electronic resource] // Text Mining, Analytics & More. — Access mode: http://www.text-analytics101.com/2014/10/all-about-stop-words-for-text-mining.html .
Переглядів анотації: 81 Завантажень PDF: 29
Опубліковано
2016-09-05
Як цитувати
[1]
М. Гранік і В. Месюра, АЛГОРИТМ ВИЗНАЧЕННЯ СХОЖОСТІ ТЕКСТІВ НОВИН НА ОСНОВІ ПОЛІНОМІАЛЬНОГО ХЕШУВАННЯ, Вісник Вінницького політехнічного інституту, № 4, с. 75-79, Вер 2016.
Номер
Розділ
Інформаційні технології та комп'ютерна техніка

Завантаження

Данные скачивания пока не доступны.