О поиске эквивалентных текстов

Д. С. Бухаров. О поиске эквивалентных текстов
Д. С. Бухаров. О поиске эквивалентных текстов
4.6 из 5, отдано 14 голосов
В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания). Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В результате проведенного эксперимента определены слабые стороны подхода. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации.
  • Категория: программы
  • Правообладатель: Синергия
  • Год написания: 2016
  • Возрастное ограничение: 0+
  • Легальная стоимость: 168.00 руб.

Читать книгу «О поиске эквивалентных текстов» онлайн:

Комментарии ():

Вам также может понравиться:

Оставайтесь на связи

Будьте в курсе новостей о выходящих книгах, подпишитесь на нашу еженедельную рассылку:
© 2011-2024. Your Lib. All Rights Reserved.