Конференции ИВТ СО РАН



MIT-2009
Международная конференция "Математические и информационные технологии"
(VIII конференция "Вычислительные и информационные технологии в науке, технике и образовании")

Копаоник, Сербия, 27 - 31 августа 2009 года;
Будва, Черногория, 31 августа - 5 сентября 2009 года

Тезисы докладов


Построение ансамбля логических моделей в кластерном анализе разнотипной информации

Бериков В.Б.

Институт математики им. С.Л.Соболева СО РАН (Новосибирск)

Алгоритмы кластерного анализа широко используются в информационных системах при решении задач классификации и обнаружения закономерностей в статистических данных: при работе с базами данных, анализе интернет-документов, сегментации изображений и т.д. В работе предлагается алгоритм автоматической группировки, основанный на коллективах логических решающих функций. Использование такого рода функций, представленных в форме деревьев решений, позволяет получать легко интерпретируемые логические модели анализируемых объектов, дает возможность обрабатывать разнотипные переменные, выделять наиболее информативные признаки. Применение ансамблей моделей значительно повышает устойчивость получаемых решений.

Разработанный алгоритм основан на вычислении согласованной матрицы различий между объектами, которая определяется по расстояниям между логическими высказываниями, описывающими кластеры. В отличие от других известных видов расстояний между кластерами, предлагаемый вид позволяет работать в разнотипном пространстве переменных как числовой, так и нечисловой природы.

Исследуются теоретические свойства байесовских логико-вероятностных моделей кластерного анализа. Предлагается новый информационный критерий качества группировки, основанный на байесовской модели классификации по конечному множеству событий.

Для подтверждения эффективности разработанного алгоритма проведено статистическое моделирование, решены тестовые задачи из репозитария UCI Machine Learning. Приведены примеры решенных прикладных задач анализа антропологических и археологических данных.

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск