Построение иерархических тематических моделей коллекции документов (С. В. Цыганова)

Построение иерархических тематических моделей коллекции документов (С. В. Цыганова)
Автор: С. В. Цыганова
Жанр: программированиеестественные наукиматематикадокументыкниги о компьютерахтекстовый материалсемантический анализмодели и алгоритмыкластеризация
Язык: Русский
Размер: 385662 Кб
Полная версия:
Описание книги:
Для решения поставленной задачи предлагается использование вероятностных тематических моделей. Особое внимание уделяется иерархическим тематическим моделям и, в частности, обсуждению свойств алгоритмов PLSA и LDA. Особенность построения иерархической модели заключается в переходе от понятия «мешка слов» к «мешку документов» в реализации плоских алгоритмов кластеризации. Работа алгоритмов иллюстрируется на текстах тезисов конференции Euro-2012 и на синтетических данных.