Mazkur maqola kvant belgilarni shakllantirish va ular asosida matnlarni tasniflash masalasini hal etishga bag‘ishlangan. Unda sarkazmlarni neyron tarmoq orqali tasniflash uchun kvant one-hot algoritmi taklif etilgan. Bugungi kunda sarkazmlar ijtimoiy tarmoq, axborot saytlar va messenjer kabilarda ko‘p uchraydi. Ularni tahlil qilish va tasniflash tabiiy tilni qayta ishlash sohasining dolzarb muammolaridan biri hisoblanadi. Sarkazm ifodalari, odatda, kontekstga bog‘liq bo‘ladi. Ularni aniqlash uchun taklif etilgan kvant one-hot algoritmi matnli ma’lumotni vektor ko‘rinishida ifodalash uchun qo‘llangan va shakllantirilgan vektorlar asosida neyron tarmog‘i o‘qitilgan. Kvant one-hot algoritmi asosida matnli ma’lumotlar kvant amplitudalarga o‘tkaziladi va shu asosda vektorizatsiya natijalari bo‘yicha o‘lchash amalga oshiriladi. O‘lchash orqali kvant ma’lumotlar klassik holatga o‘tkaziladi. Bu ma’lumotlar LSTM neyron tarmog‘ida o‘qitiladi. Olib borilgan amaliy tajribalarda kvant yondashuvlar klassik yondashuvlarga nisbatan yuqori natijalar qayd etdi. Ushbu tadqiqot kvant kodlash usullarining chuqur o‘qitish tizimlarida qo‘llanish imkoniyatlarini ochib berdi. Bu matnlarni tahlil qilish sohasida yangi yondashuvlarga asos bo‘lishi mumkin.
Mazkur maqola kvant belgilarni shakllantirish va ular asosida matnlarni tasniflash masalasini hal etishga bag‘ishlangan. Unda sarkazmlarni neyron tarmoq orqali tasniflash uchun kvant one-hot algoritmi taklif etilgan. Bugungi kunda sarkazmlar ijtimoiy tarmoq, axborot saytlar va messenjer kabilarda ko‘p uchraydi. Ularni tahlil qilish va tasniflash tabiiy tilni qayta ishlash sohasining dolzarb muammolaridan biri hisoblanadi. Sarkazm ifodalari, odatda, kontekstga bog‘liq bo‘ladi. Ularni aniqlash uchun taklif etilgan kvant one-hot algoritmi matnli ma’lumotni vektor ko‘rinishida ifodalash uchun qo‘llangan va shakllantirilgan vektorlar asosida neyron tarmog‘i o‘qitilgan. Kvant one-hot algoritmi asosida matnli ma’lumotlar kvant amplitudalarga o‘tkaziladi va shu asosda vektorizatsiya natijalari bo‘yicha o‘lchash amalga oshiriladi. O‘lchash orqali kvant ma’lumotlar klassik holatga o‘tkaziladi. Bu ma’lumotlar LSTM neyron tarmog‘ida o‘qitiladi. Olib borilgan amaliy tajribalarda kvant yondashuvlar klassik yondashuvlarga nisbatan yuqori natijalar qayd etdi. Ushbu tadqiqot kvant kodlash usullarining chuqur o‘qitish tizimlarida qo‘llanish imkoniyatlarini ochib berdi. Bu matnlarni tahlil qilish sohasida yangi yondashuvlarga asos bo‘lishi mumkin.
Данная статья посвящена решению задачи формирования квантовых признаков и классификации текстов на их основе. В работе предложен квантовый алгоритм one-hot для классификации выражений сарказма посредством нейронной сети. В настоящее время саркастические высказывания широко распространены в социальных сетях, на информационных сайтах и в мессенджерах. Их анализ и классификация являются одной из актуальных задач области обработки естественного языка. Саркастические выражения, как правило, зависят от контекста. Для их выявления предложенный квантовый алгоритм one-hot использован для представления текстовых данных в векторной форме, и на основе сформированных векторов произведено обучение нейронной сети. На основе квантового алгоритма one-hot текстовые данные переводятся в квантовые амплитуды, после чего в соответствии с результатами векторизации выполняется измерение. Путём измерения квантовые данные переводятся в классическое состояние. Эти данные используются для обучения нейронной сети LSTM. Проведённые экспериментальные исследования показали, что квантовые подходы обеспечивают более высокие результаты по сравнению с классическими. Данное исследование раскрывает возможности применения квантовых методов кодирования в системах глубокого обучения и может послужить основой для появления новых подходов в области анализа текстов.
This article is devoted to solving the problem of forming quantum features and classifying texts based on them. A quantum one-hot algorithm is proposed for classifying sarcastic expressions using a neural network. Today, sarcasm is frequently encountered on social networks, information websites, and messengers. Its analysis and classification constitute one of the pressing challenges in the field of natural language processing. Sarcastic expressions are generally context-dependent. To detect them, the proposed quantum one-hot algorithm was applied to represent textual data in vector form, and a neural network was trained on the generated vectors. Based on the quantum one-hot algorithm, textual data
are transformed into quantum amplitudes, after which measurement is performed according to the vectorization results. Through measurement, the quantum data are converted into classical form. These data are then used to train an LSTM neural network. Experimental results demonstrated that quantum approaches outperform classical ones. This study highlights the potential for applying quantum encoding methods in deep learning systems, which may serve as a foundation for new approaches in text analysis.
| № | Муаллифнинг исми | Лавозими | Ташкилот номи |
|---|---|---|---|
| 1 | Niyozmatova N.A. | texnika fanlari bo‘yicha falsafa doktori (PhD), dotsent | Toshkent irrigatsiya va qishloq xo‘jaligini mexanizatsiyalash muhandislari instituti” Milliy tadqiqot universiteti |
| 2 | Turgunova N.M. | assistent | Toshkent irrigatsiya va qishloq xo‘jaligini mexanizatsiyalash muhandislari instituti” Milliy tadqiqot universiteti |
| 3 | Almuradova N.A. | assistent | Toshkent irrigatsiya va qishloq xo‘jaligini mexanizatsiyalash muhandislari instituti” Milliy tadqiqot universiteti |
| 4 | Abduraxmanova N.N. | assistent | Toshkent irrigatsiya va qishloq xo‘jaligini mexanizatsiyalash muhandislari instituti” Milliy tadqiqot universiteti |
| № | Ҳавола номи |
|---|---|
| 1 | Al Ani, M. M., Omar, N., & Nafea, A. A. (2021). A hybrid method of long short term memory and auto encoder architectures for sarcasm detection. Journal of Computer Science, 17(11), 1093–1098. https://doi.org/10.3844/jcssp.2021.1093.1098 |
| 2 | Alahakoon, D., & Tan, K. C. (2021). Data preprocessing in machine learning: A review. Information Fusion, 73, 1–13. https://doi.org/10.1016/j.inffus.2021.02.003 |
| 3 | Alexander, A., & Widdows, D. (2023). Quantum text encoding for classification tasks. IEEE/ACM SEC. |
| 4 | Bamman, D., & Smith, N. (2021). Contextualized sarcasm detection on Twitter. Proceedings of the International AAAI Conference on Web and Social Media, 9(1), 574–577. https://doi.org/10.1609/ icwsm.v9i1.14655 |
| 5 | Babanejad, M., Vechtomova, O., & Mohammad, S. (2020). Affective and contextual embeddings for sarcasm detection. Proceedings of COLING, 754–765. https://doi.org/10.18653/v1/2020.coling- main.20 |
| 6 | Cerezo, M., Verdon, G., Huang, H.-Y., Cincio, L., & Coles, P. J. (2023). Challenges and opportunities in quantum machine learning. arXiv preprint. |
| 7 | Chatterjee, N., Das, A., & Bandyopadhyay, S. (2023). A BiLSTM variational autoencoder framework for sarcasm detection under class imbalance. Soft Computing, 27, 6543–6558. https://doi. org/10.1007/s00500-023-07956-w |
| 8 | Ghosh, A., & Veale, T. (2016). Fracking sarcasm using neural network. WASSA Proceedings, 161– 169. https://doi.org/10.18653/v1/W16-0425 |
| 9 | Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8), 1735–1780. |
| 10 | Mamatov, N. S., Turg‘unova, N. M., Turg‘unov, B. X., & Samijonov, B. N. (2024). Algorithm for analysis of texts in Uzbek language. In Artficial Intelligence and Information Technologies (pp. 511– 515). CRC Press. |
| 11 | Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. arXiv:1301.3781. https://doi.org/10.48550/arXiv.1301.3781 |
| 12 | Nguyen, T., Sipola, T., & Hautamäki, J. (2024). Machine learning applications of quantum computing: A review. arXiv preprint. https://doi.org/10.34190/eccws.23.1.2258 |
| 13 | Niyozmatova, N. A., & Turg‘unova, N. M. (2025). Matnlarni vektorlashni tf_idf kvant algoritmi [TF-IDF quantum algorithm for text vectorization]. Digital Transformation and Artificial Intelligence, 3(4), 1–11. |
| 14 | Poslavskaya, Ye., & Korolev, A. (2023). Encoding categorial data: Is there anything ‘hotter’ than one-hot encoding? Huawei Novosibirsk Research Center. https://doi.org/10.48550/arXiv.2312.16930 |
| 15 | Rezvan, M. R., Sorkhi, A. G., Pirgazi, J., & Kallehbasti, M. M. P. (2024). AdvanceSplice: Integrating N-gram one-hot encoding and ensemble modeling for enhanced accuracy. Biomedical Signal Processing and Control, 92, 106017. https://doi.org/10.1016/j.bspc.2024.106017 |
| 16 | Widdows, D., Aboumrad, W., Kim, D., Ray, S., & Mei, J. (2024). Quantum natural language processing. KI – Künstliche Intelligenz [AI – Artificial Intelligence], 38, 293–310. |
| 17 | Wu, S., Li, J., Zhang, P., & Zhang, Y. (2021). Natural language processing meets quantum physics: A survey and categorization. EMNLP. |