Оптимізація системи пошуку збігів за допомогою використання алгоритмів локально-чутливого хешування наборів текстових даних

Ескіз

Дата

2014

Автори

Білощицький, Андрій Олександрович
Діхтяренко, Олександр Васильович

Заголовок журналу

Журнал ISSN

Назва тому

Видавець

КНУБА

Анотація

Запропоновано використання алгоритмів локально чутливого хешування як способу збільшення повноти вибірки у процесі перевірки текстових документів системою пошуку збігів. Розглянуто кілька відомих алгоритмів та зроблено теоретичну оцінку доцільності їх застосування. Описано принципи роботи кожного з методів та спосіб використання в рамках системи, що розробляється.

Опис

Ключові слова

хеш-функція, локально-чутливе хешування, коефіцієнт жаккара, ssdeep, minhash, simhash, кафедра інформаційних технологій, кафедра основ інформатики

Бібліографічний опис

Білощицький А. О. Оптимізація системи пошуку збігів за допомогою використання алгоритмів локально-чутливого хешування наборів текстових даних / А. О. Білощицький, О. В. Діхтяренко // Управління розвитком складних систем : зб. наук. праць / Київ. нац. ун-т буд-ва і архітектури ; гол. ред. П. П. Лізунов. – Київ : КНУБА, 2014. – № 19. – С. 113-117. - Бібліогр. : 11 назв.

Зібрання

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced