233

Most automatic speech recognition and text processing systems use statistical  models called n-grams that specify the probability of occurrence for different sequences of words in a language. This article discusses the application of the  n-gram  model  to  the  text  in  the  Karakalpak  language  in  order  to  analyze individual Karakalpak words or phrases and in which part of the  sentence  a given word occurs.  .

  • Web Address
  • DOI
  • Date of creation in the UzSCI system 23-02-2024
  • Read count 233
  • Date of publication 31-03-2022
  • Main LanguageIngliz
  • Pages13-22
Ўзбек

Nutqni avtomatik aniqlash va matnni  avtomatik qayta ishlash tizimlarining  ko‘pchiligida  tildagi  so‘zlarning  turli  ketma-ketligi  uchun  paydo bo‘lish  ehtimolini  ko‘rsatuvchi  n-gramlar  deb  ataladigan  statistik  modellardan foydalaniladi.  Ushbu  maqolada  qoraqalpoq  tilidagi  alohida  qoraqalpoqcha  so‘z yoki  iboralarni  tahlil  qilish  maqsadida  n-gramm  modelining  qoraqalpoq  tilidagi matnga qo‘llanilishi  va berilgan  so‘zning  qaysi  gap  bo‘lagida kelishi  haqida so‘z boradi.

Русский

В  большинстве  систем  автоматического  распознавания речи  и  обработки  текста  используются  статистические  модели,  называемые n-граммными,  которые  задают  вероятность  встречаемости  для  разных последовательностей  слов  языка.  В  данной  статье  рассматривается применение  n-граммной  модели  к  тексту  на  каракалпакском  языке,  чтобы проанализировать  отдельных  каракалпакских  слов  или  словосочетании  и  в каком члене предложения встречается заданное слово.

English

Most automatic speech recognition and text processing systems use statistical  models called n-grams that specify the probability of occurrence for different sequences of words in a language. This article discusses the application of the  n-gram  model  to  the  text  in  the  Karakalpak  language  in  order  to  analyze individual Karakalpak words or phrases and in which part of the  sentence  a given word occurs.  .

Author name position Name of organisation
1 Norov A.M. dotsent Karshi State University
2 Jorabekov T.K. o'qituvchi Karakalpak State university
Name of reference
1 Арипов М., Норов А. Языковое моделирование разговорной узбекской речи / Материалы республиканской научной конференции «Актуальные проблемы и применения анализа». - Карши, 4-5 октябрь, 2019. -С. 290-292.
2 Норов А.М., Саидова Д.Э. Обработка и анализ узбекских предложений по n-граммной модели // WEEQLY.RU. Электронный научный журнал “Научно-практические исследования”. Омск, 6-9 (29), 2020. -С. 28­ 30.
3 Jurafsky, D. and Martin, J.H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. - Pearson Prentice Hall, 2009. - 988 p.
4 Ковригина Л.Ю., Шилин И.А. Руководство по выполнению лабораторных работ по теме “Вероятностные языковые модели”. - СПб: Университет ИТМО, 2018. - 33 с.
5 Кипяткова И.С. Автоматическая обработка разговорной русской речи: монография / И.С. Кипяткова, А.Л. Ронжин, А.А. Карпов. СПИИРАН. - СПб: ГУАП, 2013. - 314 с.
6 Clark A., Fox C., Lappin S. (Eds.): The Handbook of Computational Linguistics and Natural Language Processing. - Wiley-Blackwell, 2010. - 800 p.
7 Siivola, V. (2007): Language models for automatic speech recognition: construction and complexity control. Doctoral thesis, Helsinki University of Technology, Dissertations in Computer and Information Science, Report D21, Espoo, Finland.
8 Levinson, Stephen C. Mathematical models for speech technology / Chichester: John Wiley & Sons. - 2005. - 261 p.
9 Mitkov R. (2003) The Oxford handbook of Computational linguistics. - Oxford University Press. - 808 p.
10 Гудков В.Ю., Гудкова Е.Ф. N-граммы в лингвистике // Вестник Челябинского государственного университета. 2011. №24(239). Филология. Искусствоведение. Вып. 57. С. 69-71.
11 https://ru.wikipedia.org/wiki - N-грамма.
Waiting