542

Одним  из  основных  проблем  систем  распознавания  речи  является  разнообразность 
естественных  языков.  Основная  часть  существующих  систем  имеют  возможность  распознать 
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках 
не введены в  эти системы из-за объективных или субъективных причин. В том числе узбекский, 
таджикский, каракалпакский и другие языки. 
В  статье  рассматривается  разпознавание  каракалпакской  речи  на  основе  системы  с 
открытым  исходным  кодом  CMU  Sphinx,  а  так  же  структура  Sphinx’а,  речевые  модели  и 
формирование базы фонем, тестирование и результаты.

  • Web Address
  • DOI
  • Date of creation in the UzSCI system 17-02-2020
  • Read count 495
  • Date of publication 10-07-2019
  • Main LanguageRus
  • Pages90-94
Ўзбек

Нутқни  таниб  олиш  тизимларини  қуришдаги  муаммолардан  бири  бу  табиий  тилнинг 
турли-туманлигидир.  Бироқ  мавжуд  тизимларнинг  катта  қисми  айрим  табиий  тиллардаги  нутқ 
маълумотларини  таниб  олиш  имкониятига  эга.  Аммо  кўплаб  тиллардаги  нутқни  таниб  олиш 
объектив  ва  субъектив  сабабларга  кўра  бундай  тизимларга  киритилмаган.  Жумладан,  ўзбек, 
тожик, қорақалпоқ ва бошқа тиллар. 
Мазкур  мақола  қорақалпоқ  тилидаги  нутқни  таниб  олишда   CMU  Sphinx  очиқ  кодли 
тизимини  тадбиқ  этишга  бағишланган  бўлиб,  унда  Sphinxнинг  тузилмаси,  нутқ  моделлари, 
қорақалпоқ  тилидаги  сўзлар  учун  фонемалар  базасини  шакллантириш  ва  тизимини  тестлаш 
натижалари келтирилган.

Русский

Одним  из  основных  проблем  систем  распознавания  речи  является  разнообразность 
естественных  языков.  Основная  часть  существующих  систем  имеют  возможность  распознать 
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках 
не введены в  эти системы из-за объективных или субъективных причин. В том числе узбекский, 
таджикский, каракалпакский и другие языки. 
В  статье  рассматривается  разпознавание  каракалпакской  речи  на  основе  системы  с 
открытым  исходным  кодом  CMU  Sphinx,  а  так  же  структура  Sphinx’а,  речевые  модели  и 
формирование базы фонем, тестирование и результаты.

English

One of the main problems of speech recognition systems is the diversity of natural languages. 
Most of the existing systems can  recognize the verbal information of some natural languages. But speech 
recognition  on  many  languages  is  not  introduced  into  these  systems  due  to  objective  or  subjective 
reasons. Including Uzbek, Tajik, Karakalpak and other languages.
The article reviews  with the recognition of Karakalpak speech based on the open  source system 
CMU Sphinx, as well as the structure of Sphinx, speech models and the  creation  of a base of phonemes, 
testing and results.

Author name position Name of organisation
1 Niyozmatova N.A. _
2 Nurimov P.B. _
Name of reference
1 Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013
2 https://cmusphinx.github.io/wiki/tutorialoverview
3 Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р.
Waiting