Конференции ИВТ СО РАН
XI конференция "Распределенные информационно-вычислительные ресурсы" (DICR-2006)
Павлодар, Казахстан, 20 – 22 сентября 2006 года
Тезисы докладов
Об одной модели интеграции разнородных web-ресурсов
Институт вычислительных технологий СО РАН (Новосибирск)
Целью данного исследования является разработка механизма интеграции разнообразных данных, описывающих одинаковые (или схожие) объекты и принадлежащих разным источником. Наиболее характерным примером являются каталоги персон: каталоги сотрудников организаций, каталоги участников конференций, каталоги авторов публикаций и пр., где представлена разнообразная информация об одних и тех же персонах.
Для этого необходимо решение следующих задач:
- Разработка механизмов публикации web-ресурсов пользователями, в т.ч. регистрацию, классификации и аннотирования.
- Разработка механизмов доступа к опубликованным ресурсам, в т.ч. функций отображения и поиска.
- Разработка средств автоматизации функционирования, в т.ч. мониторинга и актуализации данных каталогов.
Первоочередным объектом данного исследования являются следующие базовые категории web-ресурсов:
- Табличные данные – ресурсы, описывающие многомерные массивы однородных элементов.
- Бинарные данные – ресурсы, содержание которых представляет собой двоичный код и для просмотра которых используется специализированное программное обеспечение (например, изображения, звукозаписи, видеозаписи).
- Структурированные данные – ресурсы, содержание которых представляет собой упорядоченную последовательность элементов (структуру) с априори заданной семантикой (форматом). Заметим, что табличным и бинарным данным может сопутствовать структурное описание, определяющее их специфику (метаданные).
Каждая категория может расслаиваться на типы ресурсов, причем каждый тип может иметь содержать несколько подтипов ресурсов. Например, категория «Бинарные данные» может содержать тип «Изображения», который в свою очередь содержит подтип «Фотографии».
Перечисленные выше задачи должны быть решены для каждой категории ресурсов, при этом соответствующее решение должно экстраполироваться на все подтипы родительской категории.
Наиболее перспективным направлением данного исследования является разработка технологий конвертации ресурсов. Под конвертацией подразумевается изменение формата ресурса, с максимальным сохранением его структуры и семантики. Разработка соответствующих технологий может частично разрешить проблемы интеграции разнородных ресурсов определенной направленности.
Примечание. Тезисы докладов публикуются в авторской редакции
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск