Том 336 № 9 (2025)
DOI https://doi.org/10.18799/24131830/2025/9/4754
Эффективность и валидность кластерного анализа содержания микроэлементов пыли снегового покрова
Актуальность. Кластеризация как метод анализа данных нашла широкое применение в различных областях знания, где требуется классификация объектов исследования. Очевиден поиск алгоритмов, способствующих максимально эффективному использованию метода. Успешность формирования классификационного дерева иерархического кластерного анализа зависит от применяемых методов стандартизации данных. Цель: провести сравнительный анализ методов стандартизации состава химических элементов пыли снегового покрова для оценки экологической опасности загрязнения атмосферы и валидности результатов иерархического кластерного анализа. Объекты и методы. Для примера использован микроэлементный состав твердой фазы снега г. Тюмени и фоновых точек, удаленных от города более чем на 10 км. Содержание в снеговом покрове загрязняющих веществ отражает загрязнение атмосферного воздуха. На примере анализа содержания химических элементов в твердой фазе снегового покрова г. Тюмени обоснованы наиболее простые методы предварительной обработки данных с целью их стандартизации для последующего статистического анализа. Рассмотрено четыре метода стандартизации данных в сравнении с исходными данными. Результативность кластеризации оценена с помощью интегрального показателя экологического загрязнения, а ее валидность – с помощью индекса Калински–Харабаша. Для подтверждения основных выводов результаты сопоставлены с аналогичными данными по Томской области. Результаты. Показано графическое отображение геохимических спектров при использовании разных методов стандартизации данных, а также проведен анализ различий результатов кластеризации. Для их сравнения использованы данные микроэлементного состава снегового покрова Томской области. Выводы. Метод весов (%) «Weight», позволяющий выявить различия относительного содержания микроэлементов в городе и в условиях фона, оказался наиболее эффективным при графическом отображении геохимического спектра. Полагалось, что чем выше их значения, тем эффективней кластеризация; контролем служили те же показатели для снегового покрова Томской области, которые оказались согласованными с показателями для Тюмени. Установлено, что наибольшей эффективностью обладает метод стандартизации медианой и квантилями 0,25 и 0,75 «Median».
Ключевые слова:
микроэлементы, пыль снегового покрова, стандартизация данных, кластерный анализ, валидность, загрязнение атмосферы
