543

Одним  из  основных  проблем  систем  распознавания  речи  является  разнообразность 
естественных  языков.  Основная  часть  существующих  систем  имеют  возможность  распознать 
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках 
не введены в  эти системы из-за объективных или субъективных причин. В том числе узбекский, 
таджикский, каракалпакский и другие языки. 
В  статье  рассматривается  разпознавание  каракалпакской  речи  на  основе  системы  с 
открытым  исходным  кодом  CMU  Sphinx,  а  так  же  структура  Sphinx’а,  речевые  модели  и 
формирование базы фонем, тестирование и результаты.

  • Internet ҳавола
  • DOI
  • UzSCI тизимида яратилган сана 17-02-2020
  • Ўқишлар сони 496
  • Нашр санаси 10-07-2019
  • Мақола тилиRus
  • Саҳифалар сони90-94
Ўзбек

Нутқни  таниб  олиш  тизимларини  қуришдаги  муаммолардан  бири  бу  табиий  тилнинг 
турли-туманлигидир.  Бироқ  мавжуд  тизимларнинг  катта  қисми  айрим  табиий  тиллардаги  нутқ 
маълумотларини  таниб  олиш  имкониятига  эга.  Аммо  кўплаб  тиллардаги  нутқни  таниб  олиш 
объектив  ва  субъектив  сабабларга  кўра  бундай  тизимларга  киритилмаган.  Жумладан,  ўзбек, 
тожик, қорақалпоқ ва бошқа тиллар. 
Мазкур  мақола  қорақалпоқ  тилидаги  нутқни  таниб  олишда   CMU  Sphinx  очиқ  кодли 
тизимини  тадбиқ  этишга  бағишланган  бўлиб,  унда  Sphinxнинг  тузилмаси,  нутқ  моделлари, 
қорақалпоқ  тилидаги  сўзлар  учун  фонемалар  базасини  шакллантириш  ва  тизимини  тестлаш 
натижалари келтирилган.

Русский

Одним  из  основных  проблем  систем  распознавания  речи  является  разнообразность 
естественных  языков.  Основная  часть  существующих  систем  имеют  возможность  распознать 
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках 
не введены в  эти системы из-за объективных или субъективных причин. В том числе узбекский, 
таджикский, каракалпакский и другие языки. 
В  статье  рассматривается  разпознавание  каракалпакской  речи  на  основе  системы  с 
открытым  исходным  кодом  CMU  Sphinx,  а  так  же  структура  Sphinx’а,  речевые  модели  и 
формирование базы фонем, тестирование и результаты.

English

One of the main problems of speech recognition systems is the diversity of natural languages. 
Most of the existing systems can  recognize the verbal information of some natural languages. But speech 
recognition  on  many  languages  is  not  introduced  into  these  systems  due  to  objective  or  subjective 
reasons. Including Uzbek, Tajik, Karakalpak and other languages.
The article reviews  with the recognition of Karakalpak speech based on the open  source system 
CMU Sphinx, as well as the structure of Sphinx, speech models and the  creation  of a base of phonemes, 
testing and results.

Муаллифнинг исми Лавозими Ташкилот номи
1 Niyozmatova N.A. _
2 Nurimov P.B. _
Ҳавола номи
1 Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013
2 https://cmusphinx.github.io/wiki/tutorialoverview
3 Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р.
Кутилмоқда