Информационные технологии
Быстрое развитие современных информационных технологий, рост Web-ресурсов, доступных на WWW, вызвали необходимость для администраторов Web-серверов использования методов интеллектуальных анализ данных (Data mining), чтобы извлечь и оценить желательную (требованную) информацию и принять оптимальное решение.
Файлы регистрации на сервере всегда были основным источником информации о проходящем через Web-узел трафике и поведении пользователей. Подавляющее большинство средств контроля и анализа работы Web-узлов основаны на использовании этих файлов. Такие параметры, как объем получаемого узлом трафика, адреса посетителей, способы их выхода на узел и реакция на содержимое узла, оцениваются на основе сведений об обращениях к данному узлу. Однако все больше растет потребность в получении более глубокой, чем базовая, подробной и надежной информации о Web-узлах.
В настоящее время особое внимание уделяется созданию методов и вычислительных средств (программ) для анализа данных регистрационных журналов, контролю сетевой активности, а также отслеживанию вирусов и хакерских программ. Основная задача программных средств анализа Web-трафика — извлечение полезной информации из регистрационных журналов сервера. С этой целью, для детального анализа регистрационного журнала Web-серверов, применяются профессиональные Web-анализаторы. Следует отметить, что на данный момент состояние Web-анализаторов не полностью удовлетворяет перечисленным требованиям.
Новый подход для создания Web-анализаторов требует заметных дополнительных усилий для обеспечения постоянного сбора, хранения, интеллектуального анализа данных и визуализации результатов этого анализа. Для создания таких интеллектуальных Web-анализаторов могут быть использованы методы Data mining.
Использование методов интеллектуального анализа данных дает начало потребности создания серверных и клиентских интеллектуальных систем, которые могут эффективно добывать знания из WWW. Применение интеллектуальных методов может помочь решить ряд таких задач как кластеризация и анализ пользователей, классификация сайтов, прогнозирование Web-трафика, идентификация сеанса доступа, активность посетителей и др.
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск