НУТҚНИ ТАНИБ ОЛИШ ТИЗИМЛАРИ

Mamatov N S; Yuldoshev Yu Sh

1020

Ҳозирги кунда шахсни нутқи асосида таниб олиш тизимлари кўплаб йирик коорпорациялар
томонидан ишлаб чиқилган ва ишлаб чиқилмоқда. Мазкур тизимлар кўплаб соҳаларда кенг тадбиқ
этилмоқда. Жумладан, дастур ва қурилмаларни бошқаришда, стенограммаларни шакллантиришда
имконияти чекланганларни ўқитишда, таълим жараёнида ва телефон сўзлашувларида кенг тадбиқ
этилмоқда. Нутқни таниб олиш тизимини ишлаб чиқиш кўп маблағ талаб қилувчи ва ўта мураккаб
масаладир. Одатда таниб олиш тизимлари очиқ ва ёпиқ кодли турларга ажратилади. Ҳар бир тур ўзига
хос ва ўзига мос ютуқ ва камчиликларга эга. Ушбу мақола нутқни таниб олишнинг очиқ ва ёпиқ кодли
тизимлари таҳлилига бағишланган бўлиб, унда замонавий нутқни таниб олиш тизимлари ва уларнинг
хусусиятлари ўрганилган. Бу хусусиятлар асосида энг самарадор тизимлар сухандонга боғлиқлиги,
тезлиги, ташқи халақитларга ва шовқинларга нисбатан барқарорлиги билан баҳоланган.

Название журнала“Информатика ва энергетика муаммолари” Ўзбекистон журнали
Номер выпуска3-2018
Количество просмотров 1020

Ссылка в интернете

DOI

Дата создание в систему UzSCI 13-02-2020

Количество прочтений 953

Дата публикации 26-12-2018

Язык статьиO'zbek

Страницы38-42

Ключевые слова

технология

интерфейс

луғат

кутубхона

ядро

интерактив

аппарат-дастурий восита

нутқни таниб олиш

илова

нутқ технологияси

XML

ёпиқ ва очиқ кодли дастур

API

Ўзбек

Ҳозирги кунда шахсни нутқи асосида таниб олиш тизимлари кўплаб йирик коорпорациялар
томонидан ишлаб чиқилган ва ишлаб чиқилмоқда. Мазкур тизимлар кўплаб соҳаларда кенг тадбиқ
этилмоқда. Жумладан, дастур ва қурилмаларни бошқаришда, стенограммаларни шакллантиришда
имконияти чекланганларни ўқитишда, таълим жараёнида ва телефон сўзлашувларида кенг тадбиқ
этилмоқда. Нутқни таниб олиш тизимини ишлаб чиқиш кўп маблағ талаб қилувчи ва ўта мураккаб
масаладир. Одатда таниб олиш тизимлари очиқ ва ёпиқ кодли турларга ажратилади. Ҳар бир тур ўзига
хос ва ўзига мос ютуқ ва камчиликларга эга. Ушбу мақола нутқни таниб олишнинг очиқ ва ёпиқ кодли
тизимлари таҳлилига бағишланган бўлиб, унда замонавий нутқни таниб олиш тизимлари ва уларнинг
хусусиятлари ўрганилган. Бу хусусиятлар асосида энг самарадор тизимлар сухандонга боғлиқлиги,
тезлиги, ташқи халақитларга ва шовқинларга нисбатан барқарорлиги билан баҳоланган.

Ключевые слова

технология

интерфейс

луғат

кутубхона

ядро

интерактив

аппарат-дастурий восита

нутқни таниб олиш

илова

нутқ технологияси

XML

ёпиқ ва очиқ кодли дастур

API

Русский

Показано, что в настоящее время крупными корпорациями разработаны и разрабатываются
системы распознавания лиц на основе речи, которые широко применяются в различных областях: при
формировании стенограмм, в управлении обучением лиц с ограниченными возможностями, в сфере
образования и телефонных разговорах. Обосновано,что разработка системы распознавания речи является
сложной проблемой и требует больших финансовых затрат. Установлено, что системы распознавания
подразделяют на типы с открытым и закрытым кодом, каждый из которых имеет свои преимущества и
недостатки. Произведен анализ систем с открытым и закрытым кодом. Изучены современные системы
распознавания речи и их особенности. На основе этих особенностей оценены зависимость дикторов,
скорость речи, устойчивость к внешним помехам и шумам самых эффективных систем.

Ключевые слова

технология

интерфейс

словарь

библиотека

ядро

приложение

XML

API

аппаратно-программное средство

распознавание речи

речевые технологии

интерактивная программа

программа с открытым и закрытым кодом

English

Currently, large corporations have developed and are developing speech recognition systems. These
systems are widely used in various fields. In particular, in the management of programs and devices, in the formation of transcripts, in the training of persons with limited ability, in the field of education and telephone conversations.The development of a speech recognition system is a complex problem and requires a lot of financial resources. Typically, the recognition systems are divided into types with open and closed code. Each
type has its advantages and disadvantages. This article is devoted to the analysis of systems with open and closed code, in its modern speech recognition systems and their features are studied. Based on these features, the speakers' dependence, speed, stability to external noise and the noise of the most effective systems are estimated.

Ключевые слова

technology

interface

dictionary

library

application

XML

API

hardware-software tool

kernel

speech recognition

speech technology

interactive program

program with open and closed code

№ Имя автора Должность Наименование организации

1 Mamatov N.S. yetakchi ilmiy hodim Муҳаммад ал-Хоразмий номидаги Тошкент ахборот технологиялари университети ҳузуридаги ахборот-коммуникация технологиялари илмий-инновацион маркази

2 Yuldoshev Y.S. tayanch doktorant Муҳаммад ал-Хоразмий номидаги Тошкент ахборот технологиялари университети ҳузуридаги ахборот-коммуникация технологиялари илмий-инновацион маркази

№ Название ссылки

1 Ajantha Dr.V. Devi, Suganya Ms.V. An Analysis on Types of Speech Recognition and Algorithm// International Journal of Computer Science Trends and Technology (IJCS T). Vol. 4. Issue 2. Mar – Apr, 2016. Р. 350  355

2 Xiaodong He, Li Deng, Roland Kuhn, Helen Meng , Samy Bengio Introduction to the Issue on Statistical Learning Methods for Speech and Language Processing// IEEE journal of selected topics in signal processing. V ol. 4. 2010. No. 6, december, P. 913 -916

3 Шварц Э. Авторские права на пути Voice XML //Computerworld, 2001. №36

4 Центр Речевых Технологий: http://www.speechpro.ru

5 Методы автоматического распознавания речи: В 2-х книгах /Пер. с англ. Под ред. Ли У. М.: Мир, 1983. Кн. 1. - 328 с

6 Гребнов C.В. Разработка и реализация двухуровневого метода голосового управления на основе скрытых марковских моделей //Информационные технологии. 2009. №9. С. 40 - 46

7 Зачем голосовому Поиску Google нейронные сети? // habrahabr.ru URL: https://habrahabr.ru/company/google/blog/269747/ (дата обращения: 11.03.2018).

8 Поиск оптимальной аудиосистемы распознавания речи на базе открытого исходного кода//habrahabr.ru URL:https://habrahabr.ru/post/230133/(дата обращения:15.03.2018)

9 Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit //habrahabr.ru URL:https://habrahabr .ru/company/yandex/blog/198556/(дата обращения: 18.04.2018)

10 API(Интерфейс программирования приложений)//progfile.do.am URL:http://progfile.do.am/publ/programmy/api_interfejs_programmirovanija_prilozhen ij/1-1-0-32 (дата обращения: 10.04.2018)

11 http://www.speechpro.ru

12 http://www.microsoft.com/speech/

13 http://www.dragonsys.com

14 http://www.mstechnology.ru

В ожидании

№	Имя автора	Должность	Наименование организации
1	Mamatov N.S.	yetakchi ilmiy hodim	Муҳаммад ал-Хоразмий номидаги Тошкент ахборот технологиялари университети ҳузуридаги ахборот-коммуникация технологиялари илмий-инновацион маркази
2	Yuldoshev Y.S.	tayanch doktorant	Муҳаммад ал-Хоразмий номидаги Тошкент ахборот технологиялари университети ҳузуридаги ахборот-коммуникация технологиялари илмий-инновацион маркази

№	Название ссылки
1	Ajantha Dr.V. Devi, Suganya Ms.V. An Analysis on Types of Speech Recognition and Algorithm// International Journal of Computer Science Trends and Technology (IJCS T). Vol. 4. Issue 2. Mar – Apr, 2016. Р. 350  355
2	Xiaodong He, Li Deng, Roland Kuhn, Helen Meng , Samy Bengio Introduction to the Issue on Statistical Learning Methods for Speech and Language Processing// IEEE journal of selected topics in signal processing. V ol. 4. 2010. No. 6, december, P. 913 -916
3	Шварц Э. Авторские права на пути Voice XML //Computerworld, 2001. №36
4	Центр Речевых Технологий: http://www.speechpro.ru
5	Методы автоматического распознавания речи: В 2-х книгах /Пер. с англ. Под ред. Ли У. М.: Мир, 1983. Кн. 1. - 328 с
6	Гребнов C.В. Разработка и реализация двухуровневого метода голосового управления на основе скрытых марковских моделей //Информационные технологии. 2009. №9. С. 40 - 46
7	Зачем голосовому Поиску Google нейронные сети? // habrahabr.ru URL: https://habrahabr.ru/company/google/blog/269747/ (дата обращения: 11.03.2018).
8	Поиск оптимальной аудиосистемы распознавания речи на базе открытого исходного кода//habrahabr.ru URL:https://habrahabr.ru/post/230133/(дата обращения:15.03.2018)
9	Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit //habrahabr.ru URL:https://habrahabr .ru/company/yandex/blog/198556/(дата обращения: 18.04.2018)
10	API(Интерфейс программирования приложений)//progfile.do.am URL:http://progfile.do.am/publ/programmy/api_interfejs_programmirovanija_prilozhen ij/1-1-0-32 (дата обращения: 10.04.2018)
11	http://www.speechpro.ru
12	http://www.microsoft.com/speech/
13	http://www.dragonsys.com
14	http://www.mstechnology.ru