Информационные технологии
Основная проблема автоматической классификации интернет ресурсов - это непоследовательные и ненадежные метаданные, описывающих ресурсы в Сети. Для структуризации метаданных предлагается использовать схему Resource Definition Framework (RDF), которая обеспечивает набор стандартных элементов для описания ресурсов, а также возможность создания расширенных элементов, которые определяется и выражаются с помощью стандартной схемы.
Эта работа рассматривает автоматический классификатор, который классифицирует документы HTML согласно выбранной классификационной модели, может использоваться, чтобы извлечь контекстно-зависимые метаданные, которые затем описываются с помощью RDF-схемы.
Для реализации системы выбраны ресурсы, описывающие небольшую предметную область, для которой предложена классификационная модель, модель метаданных в виде RDF схемы, а также алгоритм классификации HTML-документа.
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск
Дата последней модификации: 06-Jul-2012 (11:47:01)