Т. 320, № 5 : Управление, вычислительная техника и информатика

Классификация текстов на основе оценки семантической близости терминов

Рассматривается способ увеличения точности классификации текстов по алгоритму kNN путем применения оценки семантической близости на основе матрицы совместной встречаемости терминов. Предлагается метод уменьшения размера матрицы совместной встречаемости путем фильтрации терминов по частям речи. Выполнена проверка влияния метода фильтрации на точность классификации.

Ключевые слова:

классификация, тексты, классификаторы, k-Nearest Neighbor, kNN, семантическая близость, термины, части речи, фильтрация, матрицы, совместная встречаемость, размерность, труды учёных ТПУ, электронный ресурс,

Авторы:

Нгуен Ба Нгок Array

Тузовский Анатолий Федорович

Скачать PDF