Ушбу мақола тасвирлардан матнни аниқлаш учун сунъий интеллектнинг (СИ) ютуқлари ва методологияларини ўрганади, оптик белгиларни аниқлаш (ОБА) ва унинг СИ томонидан бошқариладиган такомиллаштирилган ёндашувларига эътибор қаратади. У турли хил матн шаклларини таниб олишда аниқлик ва мослашувчанликни яхшилайдиган чуқур ўрганиш, конволюцион нейрон тармоқлар (КНТ) ва такрорий нейрон тармоқлар (ТНТ) каби турли хил СИ моделларини ўрганади. Мақолада ушбу тизимлар дуч келадиган муаммолар, масалан, паст сифатли тасвирлардаги матн, турли шрифтлар, тиллар ва мураккаб тартиблар муҳокама қилинади. Хусусан, у олдиндан ўргатилган моделлар, мослашувчан ўрганиш ва реал вақтда ишлов беришни такомиллаштириш каби ушбу қийинчиликларни ҳал қилувчи СИ усулларини таъкидлайди. Кейс тадқиқотлари орқали у ҳужжатларни рақамлаштириш, автоматлаштирилган таржима ва маълумотларни олиш каби соҳалардаги иловаларни кўрсатади. Бундан ташқари, мақола юқори аниқлик ставкаларини таъминлаш учун анъанавий ОБА ва машинани ўрганишни бирлаштирган гибрид СИ моделларининг самарадорлигини баҳолайди. Ушбу соҳадаги келажакдаги тадқиқот йўналишлари тақдим этилган бўлиб, матнни аниқлашни янада қулайроқ, кенгайтириладиган ва турли соҳаларда қўлланилишини таъминлашда СИ ролини таъкидлайди. Ушбу иш визуал матнни аниқлашда сунъий интеллектнинг амалий қўлланилиши ва трансформацион салоҳияти ҳақида тушунча беради, бу эса автоматлаштирилган маълумот олишда кейинги инновациялар учун асос яратади.
This article explores the achievements and methodologies of artificial intelligence (AI) for text recognition from images, focusing on optical character recognition (OCR) and its AI-driven advanced approaches. It examines various AI models, such as deep learning, convolutional neural networks (CNNs), and recurrent neural networks (RNNs), which enhance accuracy and flexibility in recognizing different text forms. The article discusses the challenges these systems face, such as text in low-quality images, various fonts, languages, and complex layouts. Specifically, it highlights AI methods that address these challenges, including pre-trained models, adaptive learning, and real-time processing improvements. Through case studies, it demonstrates applications in areas such as document digitization, automated translation, and data extraction. Furthermore, the article evaluates the effectiveness of hybrid AI models that combine traditional OCR with machine learning to ensure high accuracy rates. The future research directions in this field are presented, emphasizing AI’s role in making text recognition more accessible, scalable, and applicable across different domains. This work provides insights into the practical application and transformative potential of AI in visual text recognition, laying the foundation for future innovations in automated data extraction.
Эта статья изучает достижения и методологии искусственного интеллекта (ИИ) для распознавания текста на изображениях, с акцентом на оптическое распознавание символов (ОСР) и улучшенные подходы, управляемые ИИ. В статье рассматриваются различные модели ИИ, такие как глубокое обучение, сверточные нейронные сети (СНС) и рекуррентные нейронные сети (РНС), которые повышают точность и гибкость распознавания различных форм текста. Также обсуждаются проблемы, с которыми сталкиваются эти системы, такие как текст на изображениях низкого качества, различные шрифты, языки и сложные структуры. В частности, подчеркиваются методы ИИ, решающие эти трудности, такие как предварительно обученные модели, адаптивное обучение и обработка в реальном времени. Через примеры кейс-исследований демонстрируются приложения в таких областях, как оцифровка документов, автоматизированный перевод и извлечение данных. Кроме того, статья оценивает эффективность гибридных моделей ИИ, объединяющих традиционные ОСР и машинное обучение, для обеспечения высокой точности. Также представлены направления будущих исследований в этой области, подчеркивающие роль ИИ в дальнейшем упрощении, расширении и применении распознавания текста в различных областях. Эта работа дает представление о практическом применении ИИ в визуальном распознавании текста и его трансформационном потенциале, что создает основу для будущих инноваций в области автоматизированного извлечения данных.
Ушбу мақола тасвирлардан матнни аниқлаш учун сунъий интеллектнинг (СИ) ютуқлари ва методологияларини ўрганади, оптик белгиларни аниқлаш (ОБА) ва унинг СИ томонидан бошқариладиган такомиллаштирилган ёндашувларига эътибор қаратади. У турли хил матн шаклларини таниб олишда аниқлик ва мослашувчанликни яхшилайдиган чуқур ўрганиш, конволюцион нейрон тармоқлар (КНТ) ва такрорий нейрон тармоқлар (ТНТ) каби турли хил СИ моделларини ўрганади. Мақолада ушбу тизимлар дуч келадиган муаммолар, масалан, паст сифатли тасвирлардаги матн, турли шрифтлар, тиллар ва мураккаб тартиблар муҳокама қилинади. Хусусан, у олдиндан ўргатилган моделлар, мослашувчан ўрганиш ва реал вақтда ишлов беришни такомиллаштириш каби ушбу қийинчиликларни ҳал қилувчи СИ усулларини таъкидлайди. Кейс тадқиқотлари орқали у ҳужжатларни рақамлаштириш, автоматлаштирилган таржима ва маълумотларни олиш каби соҳалардаги иловаларни кўрсатади. Бундан ташқари, мақола юқори аниқлик ставкаларини таъминлаш учун анъанавий ОБА ва машинани ўрганишни бирлаштирган гибрид СИ моделларининг самарадорлигини баҳолайди. Ушбу соҳадаги келажакдаги тадқиқот йўналишлари тақдим этилган бўлиб, матнни аниқлашни янада қулайроқ, кенгайтириладиган ва турли соҳаларда қўлланилишини таъминлашда СИ ролини таъкидлайди. Ушбу иш визуал матнни аниқлашда сунъий интеллектнинг амалий қўлланилиши ва трансформацион салоҳияти ҳақида тушунча беради, бу эса автоматлаштирилган маълумот олишда кейинги инновациялар учун асос яратади.
№ | Muallifning F.I.Sh. | Lavozimi | Tashkilot nomi |
---|---|---|---|
1 | Gilyasova G.. | бош мутахассиси | Ахборот-кутубхонa фондларини жамлаш химати |
№ | Havola nomi |
---|---|
1 | 1.Nurmatovich, Tojimamatov Israil, and Alimamadov Nurmuhammad Alimardon o’g’li. «Sun’iy neyron tarmoqlarida o’qituvchili va o’qituvchisiz o’rgatish usullari: nazariya, amaliyot va tanlov masalalari.» Ilm fan xabarnomasi 1.2 (2024): 111-114. |
2 | 2.Fan, Hu. «Research on innovation and application of 5G using artificial intelligence-based image and speech recognition technologies.» Journal of King Saud University-Science 35.4 (2023): 102626. |
3 | 3.Jena, Biswajit, et al. «Artificial intelligence-based hybrid deep learning models for image classification: The first narrative review.» Computers in Biology and Medicine 137 (2021): 104803. |
4 | 4.Xolmanova, Zulxumor. «Sun’iy intellekt: boris.» Computer linguistics: problems, solutions, prospects 1.1 (2023). |
5 | 5.Bekmuratov, K. A., O. A. Mamaraufov, and D. K. Bekmuratov. «Sun’iy intellekt.» Oliy ta’lim muassasalari uchun uslubiy qo’llanma. Tashkent.«Navro’z» nashriyoti DUK 366 (2015). |