ВИКОРИСТАННЯ МНОЖИНИ МІКРОФОНІВ У АВТОМАТИЗОВАНІЙ СИСТЕМІ РОЗПІЗНАВАННЯ МОВЦЯ КРИТИЧНОГО ЗАСТОСУВАННЯ

  • М. М. Биков Вінницький національний технічний університет
  • В. В. Ковтун Вінницький національний технічний університет

Анотація

Досліджено залежність якісних показників роботи автоматизованої системи розпізнавання мовців критичного застосування від використання множини мікрофонів для розпізнавання інформації. Для прийняття рішення щодо особи мовця використано суміші гаусових розподілів. Запропоновано правила формулювання остаточного рішення щодо особи мовця, які узагальнюють результати розпізнавання за інформацією від кожного мікрофону окремо.

Дані про авторів

М. М. Биков, Вінницький національний технічний університет

канд. техн. наук, доцент, професор кафедри комп’ютерних систем управління

В. В. Ковтун, Вінницький національний технічний університет

канд. техн. наук, доцент, професор кафедри комп’ютерних систем управління

Посилання

1. Биков М. М. Надійний метод виділення складових сегментів у мовному сигналі / М. М. Биков, В. В. Ковтун, Н. Г. Савінова [Електронний ресурс] // Наукові праці Вінницького національного технічного університету. — 2007. — № 1. — С. 1—6. — Режим доступу : https://praci.vntu.edu.ua/index.php/praci .
2. A short tutorial on Gaussian Mixture Models [Electronic resource] // 14th Conference on Computer and Robot Vision. Edmonton, Alberta. — May 17-19, 2017. — Access mode :
http://www.computerrobotvision.org/2010/tutorial_day/GMM_said_crv10_tutorial.pdf .
3. Reynolds D. A. Speaker verification using adapted Gaussian mixture models / D. A. Reynolds, T. F. Quatieri, R. B. Dunn // Digital Signal Processing. — 2000. — Vol. 10. — P. 19—41.
4. Kittler J. Combining classifiers / J. Kittler, M. Hatef, P.W. Duin // Proc. 7th German Workshop on Color Image Processing (ICPR'96), Erlangen, Germany, 1996. — Vol. 2. — P. 897—901.
5. NOIZEUS: Noisy speech corpus — Univ. Texas-Dallas [Electronic resource]. — Access mode :
http://ecs.utdallas.edu/loizou/speech/noizeus/ .
6. Рабинер Л. Р. Цифровая обработка речевых сигналов / Л. Р. Рабинер, Р. В. Шафер. — М. : Радио и связь, 1981. — 593 c.
7. Perceptual Linear Predictive (PLP) Analysis of Speech [Electronic resource]. — Access mode :
http://seed.ucsd.edu/mediawiki/images/5/5c/PLP.pdf .
8. RASTA Processing of Speech [Electronic resource] // LABrosa. — Access mode :
https://labrosa.ee.columbia.edu/~dpwe/papers/HermM94-rasta.pdf .
9. Reynolds D. A. Robust text-independent speaker identification using Gaussian mixture speaker models / D. A. Reynolds, R. C. Rose // IEEE Trans. Speech Audio Process. — 1995. — Vol. 3. — P. 72—83.
Опубліковано
2017-06-23
Як цитувати
БИКОВ, М. М.; КОВТУН, В. В.. ВИКОРИСТАННЯ МНОЖИНИ МІКРОФОНІВ У АВТОМАТИЗОВАНІЙ СИСТЕМІ РОЗПІЗНАВАННЯ МОВЦЯ КРИТИЧНОГО ЗАСТОСУВАННЯ. Вісник Вінницького політехнічного інституту, [S.l.], n. 3, p. 84-91, june 2017. ISSN 1997-9274. Доступно за адресою: <https://visnyk.vntu.edu.ua/index.php/visnyk/article/view/2065>. Дата доступу: 20 nov. 2017
Номер
Розділ
Інформаційні технології та комп'ютерна техніка
Ключові слова:
автоматизована система розпізнавання мовців критичного застосування, розпізнавання образів, кепстральний аналіз, суміш гаусових розподілів, мовний сигнал