Ҳозирги кунда шахсни нутқи асосида таниб олиш тизимлари кўплаб йирик коорпорациялар
томонидан ишлаб чиқилган ва ишлаб чиқилмоқда. Мазкур тизимлар кўплаб соҳаларда кенг тадбиқ
этилмоқда. Жумладан, дастур ва қурилмаларни бошқаришда, стенограммаларни шакллантиришда
имконияти чекланганларни ўқитишда, таълим жараёнида ва телефон сўзлашувларида кенг тадбиқ
этилмоқда. Нутқни таниб олиш тизимини ишлаб чиқиш кўп маблағ талаб қилувчи ва ўта мураккаб
масаладир. Одатда таниб олиш тизимлари очиқ ва ёпиқ кодли турларга ажратилади. Ҳар бир тур ўзига
хос ва ўзига мос ютуқ ва камчиликларга эга. Ушбу мақола нутқни таниб олишнинг очиқ ва ёпиқ кодли
тизимлари таҳлилига бағишланган бўлиб, унда замонавий нутқни таниб олиш тизимлари ва уларнинг
хусусиятлари ўрганилган. Бу хусусиятлар асосида энг самарадор тизимлар сухандонга боғлиқлиги,
тезлиги, ташқи халақитларга ва шовқинларга нисбатан барқарорлиги билан баҳоланган.
Ҳозирги кунда шахсни нутқи асосида таниб олиш тизимлари кўплаб йирик коорпорациялар
томонидан ишлаб чиқилган ва ишлаб чиқилмоқда. Мазкур тизимлар кўплаб соҳаларда кенг тадбиқ
этилмоқда. Жумладан, дастур ва қурилмаларни бошқаришда, стенограммаларни шакллантиришда
имконияти чекланганларни ўқитишда, таълим жараёнида ва телефон сўзлашувларида кенг тадбиқ
этилмоқда. Нутқни таниб олиш тизимини ишлаб чиқиш кўп маблағ талаб қилувчи ва ўта мураккаб
масаладир. Одатда таниб олиш тизимлари очиқ ва ёпиқ кодли турларга ажратилади. Ҳар бир тур ўзига
хос ва ўзига мос ютуқ ва камчиликларга эга. Ушбу мақола нутқни таниб олишнинг очиқ ва ёпиқ кодли
тизимлари таҳлилига бағишланган бўлиб, унда замонавий нутқни таниб олиш тизимлари ва уларнинг
хусусиятлари ўрганилган. Бу хусусиятлар асосида энг самарадор тизимлар сухандонга боғлиқлиги,
тезлиги, ташқи халақитларга ва шовқинларга нисбатан барқарорлиги билан баҳоланган.
Показано, что в настоящее время крупными корпорациями разработаны и разрабатываются
системы распознавания лиц на основе речи, которые широко применяются в различных областях: при
формировании стенограмм, в управлении обучением лиц с ограниченными возможностями, в сфере
образования и телефонных разговорах. Обосновано,что разработка системы распознавания речи является
сложной проблемой и требует больших финансовых затрат. Установлено, что системы распознавания
подразделяют на типы с открытым и закрытым кодом, каждый из которых имеет свои преимущества и
недостатки. Произведен анализ систем с открытым и закрытым кодом. Изучены современные системы
распознавания речи и их особенности. На основе этих особенностей оценены зависимость дикторов,
скорость речи, устойчивость к внешним помехам и шумам самых эффективных систем.
Currently, large corporations have developed and are developing speech recognition systems. These
systems are widely used in various fields. In particular, in the management of programs and devices, in the formation of transcripts, in the training of persons with limited ability, in the field of education and telephone conversations.The development of a speech recognition system is a complex problem and requires a lot of financial resources. Typically, the recognition systems are divided into types with open and closed code. Each
type has its advantages and disadvantages. This article is devoted to the analysis of systems with open and closed code, in its modern speech recognition systems and their features are studied. Based on these features, the speakers' dependence, speed, stability to external noise and the noise of the most effective systems are estimated.
№ | Author name | position | Name of organisation |
---|---|---|---|
1 | Mamatov N.S. | yetakchi ilmiy hodim | Муҳаммад ал-Хоразмий номидаги Тошкент ахборот технологиялари университети ҳузуридаги ахборот-коммуникация технологиялари илмий-инновацион маркази |
2 | Yuldoshev Y.S. | tayanch doktorant | Муҳаммад ал-Хоразмий номидаги Тошкент ахборот технологиялари университети ҳузуридаги ахборот-коммуникация технологиялари илмий-инновацион маркази |
№ | Name of reference |
---|---|
1 | Ajantha Dr.V. Devi, Suganya Ms.V. An Analysis on Types of Speech Recognition and Algorithm// International Journal of Computer Science Trends and Technology (IJCS T). Vol. 4. Issue 2. Mar – Apr, 2016. Р. 350 355 |
2 | Xiaodong He, Li Deng, Roland Kuhn, Helen Meng , Samy Bengio Introduction to the Issue on Statistical Learning Methods for Speech and Language Processing// IEEE journal of selected topics in signal processing. V ol. 4. 2010. No. 6, december, P. 913 -916 |
3 | Шварц Э. Авторские права на пути Voice XML //Computerworld, 2001. №36 |
4 | Центр Речевых Технологий: http://www.speechpro.ru |
5 | Методы автоматического распознавания речи: В 2-х книгах /Пер. с англ. Под ред. Ли У. М.: Мир, 1983. Кн. 1. - 328 с |
6 | Гребнов C.В. Разработка и реализация двухуровневого метода голосового управления на основе скрытых марковских моделей //Информационные технологии. 2009. №9. С. 40 - 46 |
7 | Зачем голосовому Поиску Google нейронные сети? // habrahabr.ru URL: https://habrahabr.ru/company/google/blog/269747/ (дата обращения: 11.03.2018). |
8 | Поиск оптимальной аудиосистемы распознавания речи на базе открытого исходного кода//habrahabr.ru URL:https://habrahabr.ru/post/230133/(дата обращения:15.03.2018) |
9 | Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit //habrahabr.ru URL:https://habrahabr .ru/company/yandex/blog/198556/(дата обращения: 18.04.2018) |
10 | API(Интерфейс программирования приложений)//progfile.do.am URL:http://progfile.do.am/publ/programmy/api_interfejs_programmirovanija_prilozhen ij/1-1-0-32 (дата обращения: 10.04.2018) |
11 | http://www.speechpro.ru |
12 | http://www.microsoft.com/speech/ |
13 | http://www.dragonsys.com |
14 | http://www.mstechnology.ru |