РАСПОЗНАВАНИЕ КАРАКАЛПАКСКОЙ РЕЧИ С ПОМОЩЬЮ CMU  SPHINX

Niyozmatova N A; Nurimov P B

856

Одним из основных проблем систем распознавания речи является разнообразность
естественных языков. Основная часть существующих систем имеют возможность распознать
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках
не введены в эти системы из-за объективных или субъективных причин. В том числе узбекский,
таджикский, каракалпакский и другие языки.
В статье рассматривается разпознавание каракалпакской речи на основе системы с
открытым исходным кодом CMU Sphinx, а так же структура Sphinx’а, речевые модели и
формирование базы фонем, тестирование и результаты.

Название журнала“Информатика ва энергетика муаммолари” Ўзбекистон журнали
Номер выпуска1-2019
Количество просмотров 856

Ссылка в интернете

DOI

Дата создание в систему UzSCI 17-02-2020

Количество прочтений 809

Дата публикации 10-07-2019

Язык статьиRus

Страницы90-94

Ключевые слова

амплитуда

частота

критерий

речь

фонема

слова

вероятность

сигнал

признак

сегмент

Ўзбек

Нутқни таниб олиш тизимларини қуришдаги муаммолардан бири бу табиий тилнинг
турли-туманлигидир. Бироқ мавжуд тизимларнинг катта қисми айрим табиий тиллардаги нутқ
маълумотларини таниб олиш имкониятига эга. Аммо кўплаб тиллардаги нутқни таниб олиш
объектив ва субъектив сабабларга кўра бундай тизимларга киритилмаган. Жумладан, ўзбек,
тожик, қорақалпоқ ва бошқа тиллар.
Мазкур мақола қорақалпоқ тилидаги нутқни таниб олишда CMU Sphinx очиқ кодли
тизимини тадбиқ этишга бағишланган бўлиб, унда Sphinxнинг тузилмаси, нутқ моделлари,
қорақалпоқ тилидаги сўзлар учун фонемалар базасини шакллантириш ва тизимини тестлаш
натижалари келтирилган.

Ключевые слова

амплитуда

частота

мезон

сўз

модел

нутқ

белги

фонема

сигнал

эҳтимол

сегмент

Русский

Одним из основных проблем систем распознавания речи является разнообразность
естественных языков. Основная часть существующих систем имеют возможность распознать
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках
не введены в эти системы из-за объективных или субъективных причин. В том числе узбекский,
таджикский, каракалпакский и другие языки.
В статье рассматривается разпознавание каракалпакской речи на основе системы с
открытым исходным кодом CMU Sphinx, а так же структура Sphinx’а, речевые модели и
формирование базы фонем, тестирование и результаты.

Ключевые слова

амплитуда

частота

критерий

речь

фонема

слова

вероятность

сигнал

признак

сегмент

English

One of the main problems of speech recognition systems is the diversity of natural languages.
Most of the existing systems can recognize the verbal information of some natural languages. But speech
recognition on many languages is not introduced into these systems due to objective or subjective
reasons. Including Uzbek, Tajik, Karakalpak and other languages.
The article reviews with the recognition of Karakalpak speech based on the open source system
CMU Sphinx, as well as the structure of Sphinx, speech models and the creation of a base of phonemes,
testing and results.

Ключевые слова

feature

word

speech

frequency

phoneme

amplitude

signal

probability

segment

critera

№ Имя автора Должность Наименование организации

1 Niyozmatova N.A. _

2 Nurimov P.B. _

№ Название ссылки

1 Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013

2 https://cmusphinx.github.io/wiki/tutorialoverview

3 Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р.

В ожидании

№	Название ссылки
1	Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013
2	https://cmusphinx.github.io/wiki/tutorialoverview
3	Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р.