Оптимізація системи пошуку збігів за допомогою використання алгоритмів локально-чутливого хешування наборів текстових даних
Дата
2014
Автори
Білощицький, Андрій Олександрович
Діхтяренко, Олександр Васильович
Заголовок журналу
Журнал ISSN
ISSN журналу
2219-5300
Назва тому
Видавець
КНУБА
Анотація
Запропоновано використання алгоритмів локально чутливого хешування як способу збільшення повноти вибірки у процесі перевірки текстових документів системою пошуку збігів. Розглянуто кілька відомих алгоритмів та зроблено теоретичну оцінку доцільності їх застосування. Описано принципи роботи кожного з методів та спосіб використання в рамках системи, що розробляється.
Опис
Ключові слова
хеш-функція, локально-чутливе хешування, коефіцієнт жаккара, ssdeep, minhash, simhash
Кафедра авторів
кафедра інформаційних технологій, кафедра інформаційних технологій
Бібліографічний опис
Білощицький А. О. Оптимізація системи пошуку збігів за допомогою використання алгоритмів локально-чутливого хешування наборів текстових даних / А. О. Білощицький, О. В. Діхтяренко // Управління розвитком складних систем : зб. наук. праць / Київ. нац. ун-т буд-ва і архітектури ; гол. ред. П. П. Лізунов. – Київ : КНУБА, 2014. – № 19. – С. 113-117. - Бібліогр. : 11 назв.
УДК
0,2340277778