В статье рассматривается процесс сравнения тематических моделей. Из-за существования большого количества методов и подходов к оценке результатов тематического моделирования трудно определить, какой набор оценок лучше. На основе анализа предметной области составлен набор критериев и оценок для проведения сравнительного анализа тематических моделей, использованы как внутренние оценки, так и внешние (экспертное мнение). Полученный набор оценок был применен к трем тематическим моделям, обученных с помощью таких алгоритмов, как LDA, LSI, NMF. Модели обучались на собранном корпусе текстов, связанных с тематикой изменения климата.
Информационные технологии и математическое моделирование (ИТММ-2022) : материалы XXI Международной конференции имени А. Ф. Терпугова, 25-29 октября 2022 г.. Томск, 2023. С. 53-58