РАСПОЗНАВАНИЕ КАРАКАЛПАКСКОЙ РЕЧИ С ПОМОЩЬЮ CMU  SPHINX

Niyozmatova N A; Nurimov P B

866

Одним из основных проблем систем распознавания речи является разнообразность
естественных языков. Основная часть существующих систем имеют возможность распознать
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках
не введены в эти системы из-за объективных или субъективных причин. В том числе узбекский,
таджикский, каракалпакский и другие языки.
В статье рассматривается разпознавание каракалпакской речи на основе системы с
открытым исходным кодом CMU Sphinx, а так же структура Sphinx’а, речевые модели и
формирование базы фонем, тестирование и результаты.

Журнал номи“Информатика ва энергетика муаммолари” Ўзбекистон журнали
Нашр номи1-2019
Кўришлар сони 866

Internet ҳавола

DOI

UzSCI тизимида яратилган сана 17-02-2020

Ўқишлар сони 819

Нашр санаси 10-07-2019

Мақола тилиRus

Саҳифалар сони90-94

Калит сўзлар

амплитуда

частота

критерий

речь

фонема

слова

вероятность

сигнал

признак

сегмент

Ўзбек

Нутқни таниб олиш тизимларини қуришдаги муаммолардан бири бу табиий тилнинг
турли-туманлигидир. Бироқ мавжуд тизимларнинг катта қисми айрим табиий тиллардаги нутқ
маълумотларини таниб олиш имкониятига эга. Аммо кўплаб тиллардаги нутқни таниб олиш
объектив ва субъектив сабабларга кўра бундай тизимларга киритилмаган. Жумладан, ўзбек,
тожик, қорақалпоқ ва бошқа тиллар.
Мазкур мақола қорақалпоқ тилидаги нутқни таниб олишда CMU Sphinx очиқ кодли
тизимини тадбиқ этишга бағишланган бўлиб, унда Sphinxнинг тузилмаси, нутқ моделлари,
қорақалпоқ тилидаги сўзлар учун фонемалар базасини шакллантириш ва тизимини тестлаш
натижалари келтирилган.

Калит сўзлар

амплитуда

частота

мезон

сўз

модел

нутқ

белги

фонема

сигнал

эҳтимол

сегмент

Русский

Одним из основных проблем систем распознавания речи является разнообразность
естественных языков. Основная часть существующих систем имеют возможность распознать
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках
не введены в эти системы из-за объективных или субъективных причин. В том числе узбекский,
таджикский, каракалпакский и другие языки.
В статье рассматривается разпознавание каракалпакской речи на основе системы с
открытым исходным кодом CMU Sphinx, а так же структура Sphinx’а, речевые модели и
формирование базы фонем, тестирование и результаты.

Калит сўзлар

амплитуда

частота

критерий

речь

фонема

слова

вероятность

сигнал

признак

сегмент

English

One of the main problems of speech recognition systems is the diversity of natural languages.
Most of the existing systems can recognize the verbal information of some natural languages. But speech
recognition on many languages is not introduced into these systems due to objective or subjective
reasons. Including Uzbek, Tajik, Karakalpak and other languages.
The article reviews with the recognition of Karakalpak speech based on the open source system
CMU Sphinx, as well as the structure of Sphinx, speech models and the creation of a base of phonemes,
testing and results.

Калит сўзлар

feature

word

speech

frequency

phoneme

amplitude

signal

probability

segment

critera

№ Муаллифнинг исми Лавозими Ташкилот номи

1 Niyozmatova N.A. _

2 Nurimov P.B. _

№ Ҳавола номи

1 Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013

2 https://cmusphinx.github.io/wiki/tutorialoverview

3 Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р.

Кутилмоқда

№	Ҳавола номи
1	Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013
2	https://cmusphinx.github.io/wiki/tutorialoverview
3	Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р.