Информационная система "Конференции"



Международная конференция молодых ученых по математическому моделированию и информационным технологиям

29-31 октября 2002 года, Новосибирск, Академгородок

Тезисы докладов


Информационные технологии

Автоматическая классификация интернет-ресурсов

Егоров Г.В.

Институт вычислительных технологий СО РАН (Новосибирск)

Основная проблема автоматической классификации интернет ресурсов - это непоследовательные и ненадежные метаданные, описывающих ресурсы в Сети. Для структуризации метаданных предлагается использовать схему Resource Definition Framework (RDF), которая обеспечивает набор стандартных элементов для описания ресурсов, а также возможность создания расширенных элементов, которые определяется и выражаются с помощью стандартной схемы.

Эта работа рассматривает автоматический классификатор, который классифицирует документы HTML согласно выбранной классификационной модели, может использоваться, чтобы извлечь контекстно-зависимые метаданные, которые затем описываются с помощью RDF-схемы.

Для реализации системы выбраны ресурсы, описывающие небольшую предметную область, для которой предложена классификационная модель, модель метаданных в виде RDF схемы, а также алгоритм классификации HTML-документа.

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск
    Дата последней модификации: 06-Jul-2012 (11:47:01)