Одним из основных проблем систем распознавания речи является разнообразность
естественных языков. Основная часть существующих систем имеют возможность распознать
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках
не введены в эти системы из-за объективных или субъективных причин. В том числе узбекский,
таджикский, каракалпакский и другие языки.
В статье рассматривается разпознавание каракалпакской речи на основе системы с
открытым исходным кодом CMU Sphinx, а так же структура Sphinx’а, речевые модели и
формирование базы фонем, тестирование и результаты.
Нутқни таниб олиш тизимларини қуришдаги муаммолардан бири бу табиий тилнинг
турли-туманлигидир. Бироқ мавжуд тизимларнинг катта қисми айрим табиий тиллардаги нутқ
маълумотларини таниб олиш имкониятига эга. Аммо кўплаб тиллардаги нутқни таниб олиш
объектив ва субъектив сабабларга кўра бундай тизимларга киритилмаган. Жумладан, ўзбек,
тожик, қорақалпоқ ва бошқа тиллар.
Мазкур мақола қорақалпоқ тилидаги нутқни таниб олишда CMU Sphinx очиқ кодли
тизимини тадбиқ этишга бағишланган бўлиб, унда Sphinxнинг тузилмаси, нутқ моделлари,
қорақалпоқ тилидаги сўзлар учун фонемалар базасини шакллантириш ва тизимини тестлаш
натижалари келтирилган.
Одним из основных проблем систем распознавания речи является разнообразность
естественных языков. Основная часть существующих систем имеют возможность распознать
речевую информацию некоторых естественных языков. Но распознавание речи на многих языках
не введены в эти системы из-за объективных или субъективных причин. В том числе узбекский,
таджикский, каракалпакский и другие языки.
В статье рассматривается разпознавание каракалпакской речи на основе системы с
открытым исходным кодом CMU Sphinx, а так же структура Sphinx’а, речевые модели и
формирование базы фонем, тестирование и результаты.
One of the main problems of speech recognition systems is the diversity of natural languages.
Most of the existing systems can recognize the verbal information of some natural languages. But speech
recognition on many languages is not introduced into these systems due to objective or subjective
reasons. Including Uzbek, Tajik, Karakalpak and other languages.
The article reviews with the recognition of Karakalpak speech based on the open source system
CMU Sphinx, as well as the structure of Sphinx, speech models and the creation of a base of phonemes,
testing and results.
№ | Author name | position | Name of organisation |
---|---|---|---|
1 | Niyozmatova N.A. | _ | |
2 | Nurimov P.B. | _ |
№ | Name of reference |
---|---|
1 | Кипяткова И. С. , Ронжин А. Л. , Карпов А. А. Автоматическая обработка разговорной русской речи. Санкт-Петербург 2013 |
2 | https://cmusphinx.github.io/wiki/tutorialoverview |
3 | Rabiner L., Juang В . - Н . Fundamentals of Speech Recognition. Prentice Hall.-1993.- 507 р. |