ВИКОРИСТАННЯ МНОЖИНИ МІКРОФОНІВ У АВТОМАТИЗОВАНІЙ СИСТЕМІ РОЗПІЗНАВАННЯ МОВЦЯ КРИТИЧНОГО ЗАСТОСУВАННЯ

  • М. М. Биков Вінницький національний технічний університет
  • В. В. Ковтун Вінницький національний технічний університет
Ключові слова: автоматизована система розпізнавання мовців критичного застосування, розпізнавання образів, кепстральний аналіз, суміш гаусових розподілів, мовний сигнал

Анотація

Досліджено залежність якісних показників роботи автоматизованої системи розпізнавання мовців критичного застосування від використання множини мікрофонів для розпізнавання інформації. Для прийняття рішення щодо особи мовця використано суміші гаусових розподілів. Запропоновано правила формулювання остаточного рішення щодо особи мовця, які узагальнюють результати розпізнавання за інформацією від кожного мікрофону окремо.

Біографії авторів

М. М. Биков, Вінницький національний технічний університет

канд. техн. наук, доцент, професор кафедри комп’ютерних систем управління

В. В. Ковтун, Вінницький національний технічний університет

канд. техн. наук, доцент, професор кафедри комп’ютерних систем управління

Посилання

1. Биков М. М. Надійний метод виділення складових сегментів у мовному сигналі / М. М. Биков, В. В. Ковтун, Н. Г. Савінова [Електронний ресурс] // Наукові праці Вінницького національного технічного університету. — 2007. — № 1. — С. 1—6. — Режим доступу : https://praci.vntu.edu.ua/index.php/praci .
2. A short tutorial on Gaussian Mixture Models [Electronic resource] // 14th Conference on Computer and Robot Vision. Edmonton, Alberta. — May 17-19, 2017. — Access mode :
http://www.computerrobotvision.org/2010/tutorial_day/GMM_said_crv10_tutorial.pdf .
3. Reynolds D. A. Speaker verification using adapted Gaussian mixture models / D. A. Reynolds, T. F. Quatieri, R. B. Dunn // Digital Signal Processing. — 2000. — Vol. 10. — P. 19—41.
4. Kittler J. Combining classifiers / J. Kittler, M. Hatef, P.W. Duin // Proc. 7th German Workshop on Color Image Processing (ICPR'96), Erlangen, Germany, 1996. — Vol. 2. — P. 897—901.
5. NOIZEUS: Noisy speech corpus — Univ. Texas-Dallas [Electronic resource]. — Access mode :
http://ecs.utdallas.edu/loizou/speech/noizeus/ .
6. Рабинер Л. Р. Цифровая обработка речевых сигналов / Л. Р. Рабинер, Р. В. Шафер. — М. : Радио и связь, 1981. — 593 c.
7. Perceptual Linear Predictive (PLP) Analysis of Speech [Electronic resource]. — Access mode :
http://seed.ucsd.edu/mediawiki/images/5/5c/PLP.pdf .
8. RASTA Processing of Speech [Electronic resource] // LABrosa. — Access mode :
https://labrosa.ee.columbia.edu/~dpwe/papers/HermM94-rasta.pdf .
9. Reynolds D. A. Robust text-independent speaker identification using Gaussian mixture speaker models / D. A. Reynolds, R. C. Rose // IEEE Trans. Speech Audio Process. — 1995. — Vol. 3. — P. 72—83.
Опубліковано
2017-06-23
Як цитувати
[1]
М. Биков і В. Ковтун, ВИКОРИСТАННЯ МНОЖИНИ МІКРОФОНІВ У АВТОМАТИЗОВАНІЙ СИСТЕМІ РОЗПІЗНАВАННЯ МОВЦЯ КРИТИЧНОГО ЗАСТОСУВАННЯ, ВВПІ, no 3, pp 84-91, Чер 2017.
Номер
Розділ
Інформаційні технології та комп'ютерна техніка