Оптимізація системи пошуку збігів за допомогою використання алгоритмів локально-чутливого хешування наборів текстових даних
Дата
2014
Автори
Білощицький, Андрій Олександрович
Діхтяренко, Олександр Васильович
Заголовок журналу
Журнал ISSN
Назва тому
Видавець
КНУБА
Анотація
Запропоновано використання алгоритмів локально чутливого хешування як способу збільшення повноти вибірки у процесі перевірки текстових документів системою пошуку збігів. Розглянуто кілька відомих алгоритмів та зроблено теоретичну оцінку доцільності їх застосування. Описано принципи роботи кожного з методів та спосіб використання в рамках системи, що розробляється.
Опис
Ключові слова
хеш-функція, локально-чутливе хешування, коефіцієнт жаккара, ssdeep, minhash, simhash, кафедра інформаційних технологій, кафедра основ інформатики
Бібліографічний опис
Білощицький А. О. Оптимізація системи пошуку збігів за допомогою використання алгоритмів локально-чутливого хешування наборів текстових даних / А. О. Білощицький, О. В. Діхтяренко // Управління розвитком складних систем : зб. наук. праць / Київ. нац. ун-т буд-ва і архітектури ; гол. ред. П. П. Лізунов. – Київ : КНУБА, 2014. – № 19. – С. 113-117. - Бібліогр. : 11 назв.