РАСПОЗНАВАНИЕ КАРАКАЛПАКСКОЙ РЕЧИ С ПОМОЩЬЮ CMU  SPHINX

Niyozmatova N A; Nurimov P B

867

Одним из основных проблем систем распознавания речи является разнообразность
естественных языков. Основная часть существующих систем имеют возможность распознать
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках
не введены в эти системы из-за объективных или субъективных причин. В том числе узбекский,
таджикский, каракалпакский и другие языки.
В статье рассматривается разпознавание каракалпакской речи на основе системы с
открытым исходным кодом CMU Sphinx, а так же структура Sphinx’а, речевые модели и
формирование базы фонем, тестирование и результаты.

Name of journal“Информатика ва энергетика муаммолари” Ўзбекистон журнали
Number of edition1-2019
View count 867

Web Address

DOI

Date of creation in the UzSCI system 17-02-2020

Read count 820

Date of publication 10-07-2019

Main LanguageRus

Pages90-94

Tags

амплитуда

частота

критерий

речь

фонема

слова

вероятность

сигнал

признак

сегмент

Ўзбек

Нутқни таниб олиш тизимларини қуришдаги муаммолардан бири бу табиий тилнинг
турли-туманлигидир. Бироқ мавжуд тизимларнинг катта қисми айрим табиий тиллардаги нутқ
маълумотларини таниб олиш имкониятига эга. Аммо кўплаб тиллардаги нутқни таниб олиш
объектив ва субъектив сабабларга кўра бундай тизимларга киритилмаган. Жумладан, ўзбек,
тожик, қорақалпоқ ва бошқа тиллар.
Мазкур мақола қорақалпоқ тилидаги нутқни таниб олишда CMU Sphinx очиқ кодли
тизимини тадбиқ этишга бағишланган бўлиб, унда Sphinxнинг тузилмаси, нутқ моделлари,
қорақалпоқ тилидаги сўзлар учун фонемалар базасини шакллантириш ва тизимини тестлаш
натижалари келтирилган.

Tags

амплитуда

частота

мезон

сўз

модел

нутқ

белги

фонема

сигнал

эҳтимол

сегмент

Русский

Одним из основных проблем систем распознавания речи является разнообразность
естественных языков. Основная часть существующих систем имеют возможность распознать
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках
не введены в эти системы из-за объективных или субъективных причин. В том числе узбекский,
таджикский, каракалпакский и другие языки.
В статье рассматривается разпознавание каракалпакской речи на основе системы с
открытым исходным кодом CMU Sphinx, а так же структура Sphinx’а, речевые модели и
формирование базы фонем, тестирование и результаты.

Tags

амплитуда

частота

критерий

речь

фонема

слова

вероятность

сигнал

признак

сегмент

English

One of the main problems of speech recognition systems is the diversity of natural languages.
Most of the existing systems can recognize the verbal information of some natural languages. But speech
recognition on many languages is not introduced into these systems due to objective or subjective
reasons. Including Uzbek, Tajik, Karakalpak and other languages.
The article reviews with the recognition of Karakalpak speech based on the open source system
CMU Sphinx, as well as the structure of Sphinx, speech models and the creation of a base of phonemes,
testing and results.

Tags

feature

word

speech

frequency

phoneme

amplitude

signal

probability

segment

critera

№ Author name position Name of organisation

1 Niyozmatova N.A. _

2 Nurimov P.B. _

№ Name of reference

1 Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013

2 https://cmusphinx.github.io/wiki/tutorialoverview

3 Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р.

Waiting

№	Name of reference
1	Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013
2	https://cmusphinx.github.io/wiki/tutorialoverview
3	Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р.