O‘ZBEK TILI MATNLARI SEMANTIK O‘XSHASHLIGINI ANIQLASH  MODELLARINING ILMIY-NAZARIY TAHLILI

Admin bo'lib kirish (www.admin.slib.uz)

Tizim sinov (TEST) rejimida ishlamoqda! Murojat uchun @slib_support

Eski talqinga o'tish link

14 апрел 2026

Asosiy til:O'zbek

O‘ZBEK TILI MATNLARI SEMANTIK O‘XSHASHLIGINI ANIQLASH MODELLARINING ILMIY-NAZARIY TAHLILI

Fan yo'nalishi:Hisoblash nazariyasi va matematika

Allabergenova_Ilm-fan 1....pdf

PDF

ILM-FAN VA INNOVATSION RIVOJLANISH

Maqola chop etish see more

MAQOLA ANNOTATSIYASI

Tabiiy tilni qayta ishlash (NLP) sohasida matnlarning semantik o‘xshashligini (Semantic Textual Similarity, STS) aniqlash axborot qidirish, savol- javob tizimlari, matnni umumlashtirish va hujjatlarni avtomatik taqqoslash kabi ko‘plab amaliy vazifalarning asosini tashkil etadi. O‘zbek tili kabi resurslari cheklangan va agglyutinativ tillar uchun ushbu vazifa alohida murakkablikka ega bo‘lib, bu holat tilning boy morfologik tuzilmasi hamda belgilangan (annotatsiyalangan) ma’lumotlar to‘plamlarining yetishmasligi bilan izohlanadi. Natijada an’anaviy statistik va vektorli modellar semantik o‘xshashlikni aniqlashda yetarli aniqlikni ta’minlay olmaydi. Mazkur maqolada o‘zbek tilidagi matnlar uchun semantik o‘xshashlikni aniqlashga mo‘ljallangan gibrid yondashuv taklif etiladi. Ushbu yondashuv Siam neyron tarmog‘i arxitekturasini Transformer asosidagi til modellari, xususan, BERT va Sentence-BERT bilan integratsiyalashga tayanadi. Taklif etilgan modelda matn juftliklari umumiy og‘irliklarga ega Siam tarmog‘i orqali kodlanib, ularning semantik yaqinligi vektorlar fazosida hisoblanadi. Eksperimental tadqiqotlar natijalari shuni ko‘rsatadiki, gibrid Siam- Transformer modeli an’anaviy neyron tarmoq va klassik embedding asosidagi yondashuvlarga nisbatan yuqori aniqlik hamda barqarorlikka ega. Xususan, Spearman va Pearson korrelyatsiya koeffitsiyentlari bo‘yicha model natijalari yaxshilanganligi kuzatildi. Shuningdek, taklif etilgan yondashuv hisoblash samaradorligi jih

MUALIFLAR

Teglar

# (NLP)

Maqolani baholang

0

0 ta

Maqola idintifikatorlari

ROI:

https://eroi.uz/11.94/A026-638528

DOI:

Mavjud emas

Foydalanilgan adabiyotlar

Aggarwal, C. C., & Zhai, C. (2012). Mining text data. Springer, 514–518

Bobojonova, L., Akhundjanova, A., Ostheimer, P., & Fellenz, S. (2025). BBPOS: BERT-based part-of-speech tagging for Uzbek. In Proceedings of the Workshop on Low-Resource Semantic Language Modeling (LoReSLM), 287–293

Boudaa, S., Boudaa, T., & El-Haddadi, A. (2024). Semantic textual similarity: Overview and comparative study between Arabic and English. Computación y Sistemas, 28(3), 1209–1228

Cer, D., Diab, M., Agirre, E., Lopez-Gazpio, I., & Specia, L. (2017). SemEval-2017 Task 1: Semantic textual similarity multilingual and crosslingual evaluation. In Proceedings of the 11th International Workshop on Semantic Evaluation (SemEval-2017), 1–14

Chen, X., Awadallah, A. H., Hassan, H., Wang, W., & Cardie, C. (2019). Multi-source cross-lingual model transfer: Learning what to share. In A. Korhonen, D. Traum, & L. Màrquez (Eds.), Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, 3098–3112. https://doi. org/10.18653/v1/P19-1299

Chikoti, B. C., Jeelaga, K., Dande, A. S., & Kumar, S. (2022). Text similarity using Siamese networks and transformers. International Journal for Research in Applied Science and Engineering Technology, 10(6)

Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 4171–4186

Dong, N., Qin, M., Chang, J., Wu, C. H., Ip, W. H., & Yung, K. L. (2022). Weighted triplet loss based on deep neural networks for loop closure detection in VSLAM. Computer Communications, 186, 153– 165

Kuriyozov, E., Vilares, D., & Gómez-Rodríguez, C. (2024). BERTbek: A pretrained language model for Uzbek. In Proceedings of the 3rd Annual Meeting of the Special Interest Group on Under- Resourced Languages at LREC-COLING, 33–44

Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval. Cambridge University Press

Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. In Proceedings of the International Conference on Learning Representations (ICLR)

Mo‘minov, B. B., & Allaberganova, N. M. (2025a). Transformer arxitekturasiga asoslangan til modellari yordamida o‘zbek tili matnlarini semantik tahlil qilish. Raqamli transformatsiya va sun’iy intellekt, 3(3), 275–279

Mo‘minov, B. B., & Allaberganova, N. M. (2025b). Semantik tahlil dasturi va asosiy elementlari. Development of Science, 6(6), 68–79

Mueller, J., & Thyagarajan, A. (2016). Siamese recurrent architectures for learning sentence similarity. In Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence, 2786–2792

Muminov, B. B., & Allaberganova, N. M. (2025). A semi-supervised framework named AugSBERT-UZ for high-performance semantic textual similarity in Uzbek. Science and Innovation International Scientific Journal, 4(11), 34–45. https://doi.org/10.5281/zenodo.17693973

Neculoiu, P., Versteegh, M., & Rotaru, M. (2016). Learning text similarity with Siamese recurrent networks. In Proceedings of the 1st Workshop on Representation Learning for NLP, 148–157

Peters, M. E., Neumann, M., Iyyer, M., Gardner, M., Clark, C., Lee, K., & Zettlemoyer, L. (2018). Deep contextualized word representations. In Proceedings of NAACL-HLT, 2227–2237

Reimers, N., & Gurevych, I. (2019). Sentence-BERT: Sentence embeddings using Siamese BERT- networks. In Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing (EMNLP-IJCNLP), 3982–3992

Salaev, U., Kuriyozov, E., & Gómez-Rodríguez, C. (2022). SimRelUz: Similarity and relatedness scores as a semantic evaluation dataset for Uzbek language. In Proceedings of the 1st Annual Meeting of the ELRA/ISCA Special Interest Group on Under-Resourced Languages, 199–206

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. In Advances in Neural Information Processing Systems, 30, 5998–6008

Xo‘jamqulov, A., & Jumanazarov, J. (2025). Has multimodal learning succeeded enough to capture contextual meaning of human-to-human interaction? A survey. Digital Transformation and Artificial Intelligence, 3(3), 153–170

Xo‘jamqulov, A., & Xo‘jamqulova, N. (2024). Kompyuter ko‘rish va tabiiy tilni qayta ishlashdan foydalangan holda inson mehnat unumdorligini baholash imkoniyatlari. Digital Transformation and Artificial Intelligence, 2(3), 29–34

Xo‘jamqulov, A., Muxamadiyev, S., & Omonov, S. (2024). Integrating large language models with visual data for enhanced human–object interaction detection. In Proceedings of DTAI 2024, 306–309

Yao, T. (2021). Improving semantic meaning of BERT sentence embeddings. Stanford University

Zervanou, K., Iosif, E., & Potamianos, A. (2014). Word semantic similarity for morphologically rich languages. In Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC 2014), 1642–1648

Zmigrod, R., Mielke, S. J., Wallach, H., & Cotterell, R. (2019). Counterfactual data augmentation for mitigating gender stereotypes in languages with rich morphology. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, 1651–1661