Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration (Т. В. Какатунова)

Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration (Т. В. Какатунова)
Автор: Т. В. Какатунова
Жанр: информатика и вычислительная техникаинформацияклассификациямодели и методикистатистический анализэкономическая интеграция
Язык: Английский
Размер: Неизвестно
Бесплатный фрагмент:
Полная версия:
Описание книги:
В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).