В настоящее время при разработке веб-ресурсов в различных ситуациях используются следующие технологии: 1) статические веб-страницы, 2) автоматическое применение шаблонов оформления и элементов навигации к статическим документам, 3) динамическая генерация веб-страниц на основе данных реляционных СУБД, 4) использование систем управления сайтами (Content management system, CMS). При данных подходах часто возникают следующие проблемы: 1) несоответствие структуры веб-ресурса со структурой предметной области, что приводит к трудоемкому процессу развития и повторного использования информации веб-ресурса; 2) отсутствие стандартных решений для интеграции информации различных веб-ресурсов.
На решение подобных проблем направлена деятельность международной организации World Wide Web Consortium (W3C) в рамках ее проекта "Semantic Web". Реализация этого проекта подразумевает перенос технологий инженерии знаний [1] в Интернет и, соответственно, создание распределенной базы знаний мирового масштаба. На данный момент W3C разработано две базовых модели и формата для представления знаний в Semantic Web - Resource Description Framework (RDF) [2] и Ontology Web Language (OWL) [3].
Модель RDF является аналогом семантической сети и включает также в себя XML-формат для хранения RDF-данных. Базовыми понятиями RDF являются ресурсы, отношения, также называемые предикатами и свойствами, и утверждения, представляющие собой триаду "ресурс-субъект - отношение - ресурс-объект или литерал". OWL - это модель на базе RDF в виде набора выделенных терминов, базовыми понятиями которой являются класс, свойство и экземпляр класса. Формализованная модель предметной области в виде совокупности терминов и отношений между ними называют онтологией, поэтому язык OWL и называют языком онтологий.
Языки RDF и OWL сейчас обычно позиционируются как языки для описания веб-страниц, для обработки их поисковыми системами и прочими интеллектуальными программными агентами. Автором предлагается использовать OWL онтологии также для адекватного представления предметной области различного рода информационных веб-ресурсов - учебных, научных, познавательных, технических и проч. Статус рекомендации W3C и наличие готовых интероперабельных программных решений делают технологию Semantic Web более привлекательной, чем другие технологические решения инженерии знаний.
В предлагаемой технологии автор выделяет следующие этапы:
Для работы данной технологии, требуется некоторая среда, которая бы связывала разработанные базы знаний и шаблоны в единый работающий веб-ресурс. Автор ведет разработку подобной среды [10] на основе технологий Java Servlets и Java Server Pages путем реализации обрабатываемых на стороне сервера дополнительных тэгов, объектов и функций языка выражений для JSP. На данный момент реализована возможность создания шаблонов с применением запросов к базе знаний на языках запросов RDQL [8] и BRQL [9], возможность получения свойств объектов с использованием операции точки (подобно получению значений полей в объектно-ориентированных языках), реализован ряд вспомогательных функций (в частности, для работы с RDF списками). Также расширена функциональность библиотеки Jena [6] для импорта онтологий не только из файлов и веб-ресурсов, но и из реляционных баз данных.
Интероперабельность информации является важнейшим свойством Semantic Web. Объединение OWL онтологий осуществляется простым объединением списков утверждений, поэтому для интеграции веб-ресурсов необходимо выполнение лишь следующих требований: 1) публикация онтологий в Интернет для свободного доступа, 2) стандартизация и повторное использование существующих онтологий, 3) использование средств OWL для соотнесения понятий разных онтологий. Важным шагом на пути к интероперабельности ресурсов в Semantic Web будет создание стандартного языка запросов к RDF-хранилищам, работа над которым ведется в W3C.
В качестве примера применения предлагаемой технологии можно привести реализацию веб-представительства вуза на основе стандартизированной, принятой общественностью онтологии, за основу которой можно взять [5]. Использование готовой онтологии позволит разработчикам непосредственно приступить к заполнению данных и построению шаблонов и дизайна. В случае открытой публикации RDF-данных возможна реализация программных агентов для поиска этих данных (к примеру, с помощью специальных запросов системы Google), агрегация в едином хранилище и предоставление данных пользователям (например, абитуриентом) в едином интерфейсе со специфическими функциями. Могут быть просто интегрированы данные подразделений и представительств вуза, которые редактируются редактором онтологий на местах и импортируются с основного веб-сайта вуза. В случае интеграции достаточно больших и часто меняющихся распределенных данных (например, для агрегации информации о конференциях региона с веб-представительств вузов и научных организаций), возможно использование RDF-хранилищ с открытыми интерфейсами для выборки только необходимых данных (например, Joseki RDF Server [6]).
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск