Мақолада тилнинг интернет, компьютер технологиялари тилига айланиши математик лингвистика, унинг давоми бўлган компьютер лингвистикасининг шаклланганлиги ва ривожланиш даражаси билан боғлиқлиги, айниқса, сунъий интеллект учун табиий тилларни моделлаштириш муаммоси хусусида мушоҳада юритилган. Ўзбек тилининг халқаро мақомини оширишда ўзбек тили миллий корпуси катта аҳамиятга эга. Компьютер лингвистикаси фани доирасида амалга оширилаётган ишлар ўзбек тилидаги мавжуд муаммоларни ҳал этишда муҳим роль ўйнайди. Мақолада миллий корпус яратишнинг заруратлари нимада эканлиги, таълим жараёнида сўзнинг нозик қиррасини ўрганиш, уни нутқида қўллаш кўникмасини шакллантиришда нимага таяниш кераклиги, ўзбек тили миллий корпуснинг фан ва миллат учун нима аҳамияти борлиги, ўзбек тили миллий корпуснинг асосий фойдаланувчилари ким бўла олиши мумкинлиги хусусида асосли фикр-мулоҳазалар билдирилди. Корпуснинг асосий фойдаланувчилари, албатта, турли йуналишларда иш олиб бораётган тилшунос тадқиқотчилардир. Маълум бир даврдаги тилга оид ишончли статистик маълумотлар адабиётшунослар, тарихчилар ва бошка гуманитар соҳалар вакилларини ўзига жалб этиб келгандир. Тилни ўқитишда ҳам миллий корпуснинг ахамияти каттадир. Миллий корпус яратишнинг технологик жараёни хусусида фикр-мулоҳазалар баён қилинди. Жумладан, миллий корпус технологик жараёни: танланган матнлар асосида лексема ва сўз шаклларининг такрорланиши луғатини яратиш; олинган такрорланиш луғатининг ҳар қандай бирлиги учун матнни кўриб чиқиш; графикли сўзни бўғинга ажратиш ва бўғинларнинг такрорланиш луғатини тузиш; сўз захираларини саралаш; бир вақтнинг ўзида чекланмаган файлларни қайта ишлаш; ташқи белгиларга эга бўлган матнлар корпусларини яратиш кабилардан иборатлиги изоҳлаб берилган.
Мақолада тилнинг интернет, компьютер технологиялари тилига айланиши математик лингвистика, унинг давоми бўлган компьютер лингвистикасининг шаклланганлиги ва ривожланиш даражаси билан боғлиқлиги, айниқса, сунъий интеллект учун табиий тилларни моделлаштириш муаммоси хусусида мушоҳада юритилган. Ўзбек тилининг халқаро мақомини оширишда ўзбек тили миллий корпуси катта аҳамиятга эга. Компьютер лингвистикаси фани доирасида амалга оширилаётган ишлар ўзбек тилидаги мавжуд муаммоларни ҳал этишда муҳим роль ўйнайди. Мақолада миллий корпус яратишнинг заруратлари нимада эканлиги, таълим жараёнида сўзнинг нозик қиррасини ўрганиш, уни нутқида қўллаш кўникмасини шакллантиришда нимага таяниш кераклиги, ўзбек тили миллий корпуснинг фан ва миллат учун нима аҳамияти борлиги, ўзбек тили миллий корпуснинг асосий фойдаланувчилари ким бўла олиши мумкинлиги хусусида асосли фикр-мулоҳазалар билдирилди. Корпуснинг асосий фойдаланувчилари, албатта, турли йуналишларда иш олиб бораётган тилшунос тадқиқотчилардир. Маълум бир даврдаги тилга оид ишончли статистик маълумотлар адабиётшунослар, тарихчилар ва бошка гуманитар соҳалар вакилларини ўзига жалб этиб келгандир. Тилни ўқитишда ҳам миллий корпуснинг ахамияти каттадир. Миллий корпус яратишнинг технологик жараёни хусусида фикр-мулоҳазалар баён қилинди. Жумладан, миллий корпус технологик жараёни: танланган матнлар асосида лексема ва сўз шаклларининг такрорланиши луғатини яратиш; олинган такрорланиш луғатининг ҳар қандай бирлиги учун матнни кўриб чиқиш; графикли сўзни бўғинга ажратиш ва бўғинларнинг такрорланиш луғатини тузиш; сўз захираларини саралаш; бир вақтнинг ўзида чекланмаган файлларни қайта ишлаш; ташқи белгиларга эга бўлган матнлар корпусларини яратиш кабилардан иборатлиги изоҳлаб берилган.
В статье рассматривается язык в сети интернет, формирование языка компьютерных технологий как продолжение вычислительной лингвистики, ее уровни развития, особенности влияния языка на моделирование нового языка для искусственного интеллекта. Национальный корпус узбекского языка имеет большое значение для повышения международного статуса узбекского языка. Работа, выполняемая в области компьютерной лингвистики, играет важную роль в решении существующих проблем в узбекском языке. Статья основана на том, что значит строить национальный корпус, изучать тонкости слова в процессе обучения, на что опираться, чтобы развить способность использовать его в речи, какое значение имеет узбекский язык для науки и нации и кто может быть основным клиентом/ пользователем узбекского языка. Основными пользователями корпуса являются, конечно же, лингвисты, которые работают в разных областях. Надежная статистическая информация о языке определенного периода привлекает также литературоведов, историков и других представителей гуманитарных наук. Национальный язык также важен в преподавании языка. Были высказаны мнения о технологическом процессе создания национального корпуса. В частности, технологический процесс национального корпуса учитывает: создание словарного запаса лексемы и словоформы на основе выбранных текстов; возможность просмотра текста для любой единицы полученного словарного запаса; разбивка графического слова на слоги; подбор слов; одновременная обработка неограниченного количества файлов, создание текстовых файлов с внешними символами.
The article deals with the language on the Internet, the formation of the language of computer technology as a continuation of computational linguistics, its levels of development, especially the influence of language on the modeling of a new language for artificial intelligence. The national corpus of the Uzbek language is of great importance in enhancing the international status of the Uzbek language. The work being done in the field of computer linguistics plays an important role in solving the existing problems in the Uzbek language. The article explores the need for building a national corpus, to learn the subtleties of words in the learning process, what to rely on in developing the ability to use it in speech; the importance of the Uzbek language to the science and the nation, There are wellgrounded opinions about who can be the main clients and users of the Uzbek language. The main users of the corps are, of course, linguists who work in different fields. Reliable statistical information about a language of a certain period attracts literary scholars, historians, and other humanities. National language is also important in language teaching. Opinions were expressed about the technological process of creating a national corps. In particular, the technological process of the national corps takes into account: the creation of a vocabulary of the lexeme and word form based on the selected texts; view the text for any unit of the received vocabulary; break a graphic word into syllables and create syllables for repeating syllables; selection of words; The simultaneous processing of unlimited files, the creation of text files with external characters.
№ | Author name | position | Name of organisation |
---|---|---|---|
1 | Toirova G.I. | Филология фанлари бўйича фалсафа доктори (PhD), доцент | Бухоро давлат университети Бухоро тарихи кафедраси |
№ | Name of reference |
---|---|
1 | Абдурахмонова Н.З., Ҳайдаров М.Р. Ўзбек тилида WORDNET яратиш масалаларига доир // Ўзбекистонда хорижий тиллар (электрон илмий-методик журнал). № 4. 2019. — Б.19–28. — URL: https://journal.fledu.uz/uz/issue/4-27-2019 |
2 | Абжалова М. Ўзбек тилидаги матнларни таҳрир ва таҳлил қилувчи дастурнинг лингвистик модуллари (Расмий ва илмий услубдаги матнлар таҳрири дастури учун). Филол. фан. бўйича фалсафа доктори (PhD)…дис. автореф. — Фарғона, 2019. — 45 б. |
3 | Атабоев Н.Б. Корпус лингвистикасининг асосий хусусиятлари // Ўзбекистонда хорижий тиллар (электрон илмий-методик журнал). — № 2 (25) / 2019. — Б. 37–45. — URL: https://journal.fledu.uz/uz/issue/2- 25-2019/ |
4 | Мельчук И.А. Порядок слов при автоматическом синтезе русского слова (предварительные сообщении) / Научно-техническая информация. 1985, № 12. — С.12–36. |
5 | Meyer C.F. English Corpus Linguistics. — Cambridge: Cambridge University Press, 2002. — URL: https://pdfs.semanticscholar.org/c775/4bfab1d0f7 |
6 | Поляков А. Е. Технология подготовки информации в Национальном корпусе русского языка Текст. / Поляков А.Е. // Национальный корпус русского языка: 2003–2005. Результаты и перспективы. — М., 2005. — 192 с. |
7 | Toirova G. Importance of Interface in Creating Corpus// International Journal of Recent Technology and Engineering (IJRTE) ISSN: 2277– 3878, Volume 8, Issue 2S10, September 2019. — pp. 4591–4593. |
8 | Toirova G. The Role of Setting in Linguistic Modeling. International Multilingual Journal of Science and Technology. ISSN: 2528-9810 Vol. 4 Issue 9, September — 2019. — pp. 722–723. |
9 | Рыков В.В. Курс лекций по корпусной лингвистике. — URL: http://rykov-cl.narod.ru/c.html. |
10 | Савчук С.О. Корпус современной русской прессы: из опыта создания и использования // Труды Международной конференции «Корпусная лингвистика — 2011». — СПб.: Санкт-Петербургский государственный университет, 2011. — С. 149–154. |
11 | Эшмўминов А. Ўзбек тили миллий корпусининг синоним сўзлар базаси. Филол.фан.бўйича фалсафа доктори (PhD)…дис. афтореф. — Қарши, 2019. — 46 б. |
12 | Ҳамроева Ш. Ўзбек тили муаллифлик корпусини тузишнинг лингвистик асослари. Филол. фан. бўйича фалсафа доктори (PhD)…дис. автореф. — Қарши, 2018. — 45б. |