APPLICATION OF THE N-GRAM MODEL TO THE KARAKALPAK LANGUAGE

Norov Abdisait Muradovich; Jorabekov Timur Kewnimjaevich

611

Most automatic speech recognition and text processing systems use statistical models called n-grams that specify the probability of occurrence for different sequences of words in a language. This article discusses the application of the n-gram model to the text in the Karakalpak language in order to analyze individual Karakalpak words or phrases and in which part of the sentence a given word occurs. .

Название журналаElektron ta’lim
Номер выпуска2022 (6) 1-son
Количество просмотров 611

Ссылка в интернете

DOI

Дата создание в систему UzSCI 23-02-2024

Количество прочтений 611

Дата публикации 31-03-2022

Язык статьиIngliz

Страницы13-22

Ключевые слова

n-gram

statistical model

hiding Markov models

Karakalpak language

formal grammar

automatic speech analysis

Ўзбек

Nutqni avtomatik aniqlash va matnni avtomatik qayta ishlash tizimlarining ko‘pchiligida tildagi so‘zlarning turli ketma-ketligi uchun paydo bo‘lish ehtimolini ko‘rsatuvchi n-gramlar deb ataladigan statistik modellardan foydalaniladi. Ushbu maqolada qoraqalpoq tilidagi alohida qoraqalpoqcha so‘z yoki iboralarni tahlil qilish maqsadida n-gramm modelining qoraqalpoq tilidagi matnga qo‘llanilishi va berilgan so‘zning qaysi gap bo‘lagida kelishi haqida so‘z boradi.

Ключевые слова

statistik model

formal grammatika

n-gram

maxfiy Markov modeli

qoraqalpoq tili

nutqning avtomatik tahlili

Русский

В большинстве систем автоматического распознавания речи и обработки текста используются статистические модели, называемые n-граммными, которые задают вероятность встречаемости для разных последовательностей слов языка. В данной статье рассматривается применение n-граммной модели к тексту на каракалпакском языке, чтобы проанализировать отдельных каракалпакских слов или словосочетании и в каком члене предложения встречается заданное слово.

Ключевые слова

статистическая модель

n-грамма

скрытие Марковские модели

каракалпакский язык

формальная грамматика

автоматический анализ речи.

English

Most automatic speech recognition and text processing systems use statistical models called n-grams that specify the probability of occurrence for different sequences of words in a language. This article discusses the application of the n-gram model to the text in the Karakalpak language in order to analyze individual Karakalpak words or phrases and in which part of the sentence a given word occurs. .

Ключевые слова

n-gram

statistical model

hiding Markov models

Karakalpak language

formal grammar

automatic speech analysis

№ Имя автора Должность Наименование организации

1 Norov A.M. dotsent Karshi State University

2 Jorabekov T.K. o'qituvchi Karakalpak State university

№ Название ссылки

1 Арипов М., Норов А. Языковое моделирование разговорной узбекской речи / Материалы республиканской научной конференции «Актуальные проблемы и применения анализа». - Карши, 4-5 октябрь, 2019. -С. 290-292.

2 Норов А.М., Саидова Д.Э. Обработка и анализ узбекских предложений по n-граммной модели // WEEQLY.RU. Электронный научный журнал “Научно-практические исследования”. Омск, 6-9 (29), 2020. -С. 28 30.

3 Jurafsky, D. and Martin, J.H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. - Pearson Prentice Hall, 2009. - 988 p.

4 Ковригина Л.Ю., Шилин И.А. Руководство по выполнению лабораторных работ по теме “Вероятностные языковые модели”. - СПб: Университет ИТМО, 2018. - 33 с.

5 Кипяткова И.С. Автоматическая обработка разговорной русской речи: монография / И.С. Кипяткова, А.Л. Ронжин, А.А. Карпов. СПИИРАН. - СПб: ГУАП, 2013. - 314 с.

6 Clark A., Fox C., Lappin S. (Eds.): The Handbook of Computational Linguistics and Natural Language Processing. - Wiley-Blackwell, 2010. - 800 p.

7 Siivola, V. (2007): Language models for automatic speech recognition: construction and complexity control. Doctoral thesis, Helsinki University of Technology, Dissertations in Computer and Information Science, Report D21, Espoo, Finland.

8 Levinson, Stephen C. Mathematical models for speech technology / Chichester: John Wiley & Sons. - 2005. - 261 p.

9 Mitkov R. (2003) The Oxford handbook of Computational linguistics. - Oxford University Press. - 808 p.

10 Гудков В.Ю., Гудкова Е.Ф. N-граммы в лингвистике // Вестник Челябинского государственного университета. 2011. №24(239). Филология. Искусствоведение. Вып. 57. С. 69-71.

11 https://ru.wikipedia.org/wiki - N-грамма.

В ожидании

№	Имя автора	Должность	Наименование организации
1	Norov A.M.	dotsent	Karshi State University
2	Jorabekov T.K.	o'qituvchi	Karakalpak State university

№	Название ссылки
1	Арипов М., Норов А. Языковое моделирование разговорной узбекской речи / Материалы республиканской научной конференции «Актуальные проблемы и применения анализа». - Карши, 4-5 октябрь, 2019. -С. 290-292.
2	Норов А.М., Саидова Д.Э. Обработка и анализ узбекских предложений по n-граммной модели // WEEQLY.RU. Электронный научный журнал “Научно-практические исследования”. Омск, 6-9 (29), 2020. -С. 28 30.
3	Jurafsky, D. and Martin, J.H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. - Pearson Prentice Hall, 2009. - 988 p.
4	Ковригина Л.Ю., Шилин И.А. Руководство по выполнению лабораторных работ по теме “Вероятностные языковые модели”. - СПб: Университет ИТМО, 2018. - 33 с.
5	Кипяткова И.С. Автоматическая обработка разговорной русской речи: монография / И.С. Кипяткова, А.Л. Ронжин, А.А. Карпов. СПИИРАН. - СПб: ГУАП, 2013. - 314 с.
6	Clark A., Fox C., Lappin S. (Eds.): The Handbook of Computational Linguistics and Natural Language Processing. - Wiley-Blackwell, 2010. - 800 p.
7	Siivola, V. (2007): Language models for automatic speech recognition: construction and complexity control. Doctoral thesis, Helsinki University of Technology, Dissertations in Computer and Information Science, Report D21, Espoo, Finland.
8	Levinson, Stephen C. Mathematical models for speech technology / Chichester: John Wiley & Sons. - 2005. - 261 p.
9	Mitkov R. (2003) The Oxford handbook of Computational linguistics. - Oxford University Press. - 808 p.
10	Гудков В.Ю., Гудкова Е.Ф. N-граммы в лингвистике // Вестник Челябинского государственного университета. 2011. №24(239). Филология. Искусствоведение. Вып. 57. С. 69-71.
11	https://ru.wikipedia.org/wiki - N-грамма.