Определение жанра и автора литературного произведения статистическими методами

Ю. Н. Орлов. Определение жанра и автора литературного произведения статистическими методами
Ю. Н. Орлов. Определение жанра и автора литературного произведения статистическими методами
3.75 из 5, отдано 16 голосов
В работе решается задача кластеризации литературных текстов по авторам и жанрам статистическими методами. Основным инструментом анализа являются функции распределения текста по буквам и буквосочетаниям, а также выборочные буквенные распределения, построенные по фрагментам текстов. Для набора текстов, объём наименьшего из которых достаточен для того, чтобы считать буквенное распределение каждого из них стационарным с ошибкой не более 3%, вычисляются расстояния между распределениями букв в пространстве суммируемых функций. Критерий кластеризации, основанный на близости между двухбуквенными распределениями текстов, позволяет правильно идентифицировать автора с ошибкой не более 5%, а жанр – с ошибкой не более 15%. Однобуквенные распределения дают ошибку 15% и 25% соответственно.
  • Категория: математика
  • Правообладатель: Синергия
  • Год написания: 2010
  • Возрастное ограничение: 0+
  • Легальная стоимость: 168.00 руб.

Читать книгу «Определение жанра и автора литературного произведения статистическими методами» онлайн:

Комментарии ():

Вам также может понравиться:

Оставайтесь на связи

Будьте в курсе новостей о выходящих книгах, подпишитесь на нашу еженедельную рассылку:
© 2011-2024. Your Lib. All Rights Reserved.