Ishda ma’lumotlarni intellektual izlashda, ya’ni ma’lumotning tuzilishi aniq bo’lmagan holatlarda indekslash,
indekslarni siqish masalarini echish algoritmlari va usullari keltirilgan. Ma’lumotlarni izlash tizimlarida (MIT)
indekslashning apparat ta’minot vositalari bilan bog’liqligi, saralashga asoslangan blokli indekslash, BSBI algoritmi,
tezkor хotirada bir o’tishli indekslash, SPIMI algoritmi, taqsimlangan indekslash, MapReduce algoritmi, dinamik
indekslash, Logarifmik birlashtirish algoritmi, indekslashning boshqa variantlari va indekslashda хavfsizlikni
ta’minlash asosida indekslash usullaridan foydalanish usullari bayon qilingan. Shuningdek, indekslar va tartiblangan
fayllarni siqishning Хipsa va Sipfa konuni, terminlar sonini baholash va terminlarning taqsimlanishini modellashtirish,
terminlarning statistik хarakteristikalarini va lug’atni siqish, bo’lakli saqlash va frontal siqish, uzunlik orqali baytli
kodlash va – kodlash usullari va algoritmlari hamda tadqiqot asosida ulardan MITlarda foydalanish usullari, o’zaro
imkoniyatlarini taqqoslangan natijalari va foydalanish bo’yicha foydali tavsiyalar bayon qilingan.
Ishda ma’lumotlarni intellektual izlashda, ya’ni ma’lumotning tuzilishi aniq bo’lmagan holatlarda indekslash,
indekslarni siqish masalarini echish algoritmlari va usullari keltirilgan. Ma’lumotlarni izlash tizimlarida (MIT)
indekslashning apparat ta’minot vositalari bilan bog’liqligi, saralashga asoslangan blokli indekslash, BSBI algoritmi,
tezkor хotirada bir o’tishli indekslash, SPIMI algoritmi, taqsimlangan indekslash, MapReduce algoritmi, dinamik
indekslash, Logarifmik birlashtirish algoritmi, indekslashning boshqa variantlari va indekslashda хavfsizlikni
ta’minlash asosida indekslash usullaridan foydalanish usullari bayon qilingan. Shuningdek, indekslar va tartiblangan
fayllarni siqishning Хipsa va Sipfa konuni, terminlar sonini baholash va terminlarning taqsimlanishini modellashtirish,
terminlarning statistik хarakteristikalarini va lug’atni siqish, bo’lakli saqlash va frontal siqish, uzunlik orqali baytli
kodlash va – kodlash usullari va algoritmlari hamda tadqiqot asosida ulardan MITlarda foydalanish usullari, o’zaro
imkoniyatlarini taqqoslangan natijalari va foydalanish bo’yicha foydali tavsiyalar bayon qilingan.
The paper shows the algorithms and methods for indexing, compression index in the intellectual search, in cases when
it is not determined by the data structure. The author tells about the relationship of indexing devices hardware, indexing
blocks to sort through, BSBI algorithm, indexing with one shift in the ROM, SPIMI algorithm, distributed indexing,
MapReduce algorithm, dynamic indexing, algorithm logarithmic association, other indexing and the basis of security in
indexing methods for SIIs. Also, describes laws Heaps and Zipf, compression indexes and files, estimated number of
terms and modeling of distributed terms, static characteristics of terms and compression dictionary, saving on parts and
front compression, encoding length with bytes and – coding, as well methods their use in SII based on a study of
mutual comparisons of features and recommendations for use.
Приводятся алгоритмы и методы сжатия индексов, индексирования в интеллектуальном поиске в случаях,
когда не определена структура данных. Изучаются взаимосвязь индексации с устройствами аппаратного
обеспечения, индексации с блоками на основе сортировки, алгоритмом BSBI, индексации с одним переходом в
оперативной памяти, алгоритмом SPIMI, распределенной индексации, алгоритмом MapReduce, динамической
индексации, алгоритмом логарифмического объединения, другие варианты индексации и методы
использования методов индексации на основе обеспечения безопасности в индексации для ПИС. Приводится
закон Хипса и Цифа, сжатия индексов и файлов, оцененные количество терминов и моделирование
распределенных терминов, статические характеристики терминов и сжатия словаря, сохранение по частям и
фронтальное сжатие, кодирование по длине с байтами и – кодирование, а также методы их использования в
ПИСе на основе исследования, результаты взаимного сравнения возможностей и рекомендации по
использованию.
№ | Author name | position | Name of organisation |
---|---|---|---|
1 | Mo'minov B.B. | katta ilmiy хodim-izlanuvchi | Toshkent axborot texnologiyalari universiteti |
№ | Name of reference |
---|---|
1 | BSBI Algorithm. SlideWiki. [Электрон ресурс]. URL: http://slidewiki.org/deck/396 bsbi-algorithm. |
2 | Buttcher, S. Cormack. Information Retrieval: Implementing and Evaluating Search Engines / Stefan Buttcher, Charles L. A. Clarke, and Gordon V. - MIT Press, 2010. - 606 р. |
3 | Charles L. A. Clarke, Gordon V. Cormack. Dynamic Inverted Indexes for a Distributed Full-Text Retrieval System // MultiText Pro ject Technical Report MT-95-01. – University of Waterloo, Waterloo, Ontario N2L 3G1, Canada, 1995. – Pp. 556. |
4 | Cutting, D., Pedersen, J. Optimizations for dynamic inverted index maintenance / Jean-Luc Vidick. – NY, USA: ACM New York, 1990. – Vol. 2(30). - Pp. 405-411. |
5 | MapReduce – Algorithm. Tutorials point simply easy learning. [Электрон ресурс]. URL: http://www.tutorialspoint.com/map_reduce/map_reduce_ algorithm |
6 | Scoping SIG. Tokenization Taskforce PCI Security Standards Council. Info Supplement: PCI DSS Tokenization Guidelines. - 2011. - 23 р. |
7 | Трифонов А.А. Алгоритмы построения инвертированного индекса для коллекции текстовых данных // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2013. - № 3 (27). – С. 52- 61. |
8 | Ralf Lammel. Google's MapReduce Programming Model – Revisited. "Data Programmability Team Microsoft Corp. Redmond, WA, USA. 2010. – Pp. 42. |
9 | Grossman, Frieder, Goharian. IR Basics of Inverted Index. – Google, Inc, 2002. – Pp. 274. |
10 | Single-pass in-memory indexing. The Stanford Natural Language Processing Group. e-Library. [Электрон ресурс]. URL: http://nlp.stanford.edu/ /htmledition/single-pass-in-memory-indexing-1.html |
11 | Skillicorn D. B. and Talia D. Models and languages for parallel computation. // ACM Computing Surveys. 1998. – Vol. 30(2). – Pp. 123-169. |
12 | Eric W. Brown. Execution Performance Issues in Full-Text Information Retrieval. Technical Report 95-81. – University of Massachusetts Amherst: Computer Science Department, 1996. - 179 р. |
13 | Thomas Hofmann. Probabilistic latent semantic indexing. In Proc. of the SKjHR99, Berkley, CA, USA, 1999. – Pp. 50-57. |