banner banner banner

О поиске эквивалентных текстов – Д. Бухаров

Оценить:
Рейтинг: 0
Описание книги:

В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания).Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В результате проведенного эксперимента определены слабые стороны подхода. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации.

Информация о книге:

  • Язык книги: русский
  • Издательство: Синергия Периодика Литагент

Полная версия:

Поделиться:

Комментарии к книге и рекомендации пользователей:

Вместе с этим произведением обычно скачивают книги:

О скачивании, разархивировании, чтении книг можно прочитать здесь.
Новинки!
Все новинки
В этот день...
23 июля 1888 года родился Рэймонд Чандлер (Raymond (Thornton) Chandler) (ум. 1959), американский автор детективов.
Новый отзыв
скачать книгу 'Дитя Эльфа и Погремушки'
Ирина Иванова:
Читала я эту книгу, не читая аннотации перед прочтением. И это не эксперимент, так я поступаю с пров...
Новая подборка книг
В тренде
Детство. Время открытий. Время удивляться всему в мире. Радоваться, грустить, искать себя...