Most automatic speech recognition and text processing systems use statistical models called n-grams that specify the probability of occurrence for different sequences of words in a language. This article discusses the application of the n-gram model to the text in the Karakalpak language in order to analyze individual Karakalpak words or phrases and in which part of the sentence a given word occurs. .
Nutqni avtomatik aniqlash va matnni avtomatik qayta ishlash tizimlarining ko‘pchiligida tildagi so‘zlarning turli ketma-ketligi uchun paydo bo‘lish ehtimolini ko‘rsatuvchi n-gramlar deb ataladigan statistik modellardan foydalaniladi. Ushbu maqolada qoraqalpoq tilidagi alohida qoraqalpoqcha so‘z yoki iboralarni tahlil qilish maqsadida n-gramm modelining qoraqalpoq tilidagi matnga qo‘llanilishi va berilgan so‘zning qaysi gap bo‘lagida kelishi haqida so‘z boradi.
В большинстве систем автоматического распознавания речи и обработки текста используются статистические модели, называемые n-граммными, которые задают вероятность встречаемости для разных последовательностей слов языка. В данной статье рассматривается применение n-граммной модели к тексту на каракалпакском языке, чтобы проанализировать отдельных каракалпакских слов или словосочетании и в каком члене предложения встречается заданное слово.
Most automatic speech recognition and text processing systems use statistical models called n-grams that specify the probability of occurrence for different sequences of words in a language. This article discusses the application of the n-gram model to the text in the Karakalpak language in order to analyze individual Karakalpak words or phrases and in which part of the sentence a given word occurs. .
№ | Author name | position | Name of organisation |
---|---|---|---|
1 | Norov A.M. | dotsent | Karshi State University |
2 | Jorabekov T.K. | o'qituvchi | Karakalpak State university |
№ | Name of reference |
---|---|
1 | Арипов М., Норов А. Языковое моделирование разговорной узбекской речи / Материалы республиканской научной конференции «Актуальные проблемы и применения анализа». - Карши, 4-5 октябрь, 2019. -С. 290-292. |
2 | Норов А.М., Саидова Д.Э. Обработка и анализ узбекских предложений по n-граммной модели // WEEQLY.RU. Электронный научный журнал “Научно-практические исследования”. Омск, 6-9 (29), 2020. -С. 28 30. |
3 | Jurafsky, D. and Martin, J.H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. - Pearson Prentice Hall, 2009. - 988 p. |
4 | Ковригина Л.Ю., Шилин И.А. Руководство по выполнению лабораторных работ по теме “Вероятностные языковые модели”. - СПб: Университет ИТМО, 2018. - 33 с. |
5 | Кипяткова И.С. Автоматическая обработка разговорной русской речи: монография / И.С. Кипяткова, А.Л. Ронжин, А.А. Карпов. СПИИРАН. - СПб: ГУАП, 2013. - 314 с. |
6 | Clark A., Fox C., Lappin S. (Eds.): The Handbook of Computational Linguistics and Natural Language Processing. - Wiley-Blackwell, 2010. - 800 p. |
7 | Siivola, V. (2007): Language models for automatic speech recognition: construction and complexity control. Doctoral thesis, Helsinki University of Technology, Dissertations in Computer and Information Science, Report D21, Espoo, Finland. |
8 | Levinson, Stephen C. Mathematical models for speech technology / Chichester: John Wiley & Sons. - 2005. - 261 p. |
9 | Mitkov R. (2003) The Oxford handbook of Computational linguistics. - Oxford University Press. - 808 p. |
10 | Гудков В.Ю., Гудкова Е.Ф. N-граммы в лингвистике // Вестник Челябинского государственного университета. 2011. №24(239). Филология. Искусствоведение. Вып. 57. С. 69-71. |
11 | https://ru.wikipedia.org/wiki - N-грамма. |