Конференции ИВТ СО РАН


IX рабочее совещание по электронным публикациям
"EL-Pub2004” (с участием иностранных ученых)

23-25 сентября, Академгородок, Новосибирск

Тезисы докладов


Разработка и интеграция веб-ресурсов с использованием онтологий

Бархатов А.В.

Красноярский государственный университет,
Интернет Центр (Красноярск)

В настоящее время при разработке веб-ресурсов в различных ситуациях используются следующие технологии: 1) статические веб-страницы, 2) автоматическое применение шаблонов оформления и элементов навигации к статическим документам, 3) динамическая генерация веб-страниц на основе данных реляционных СУБД, 4) использование систем управления сайтами (Content management system, CMS). При данных подходах часто возникают следующие проблемы: 1) несоответствие структуры веб-ресурса со структурой предметной области, что приводит к трудоемкому процессу развития и повторного использования информации веб-ресурса; 2) отсутствие стандартных решений для интеграции информации различных веб-ресурсов.

На решение подобных проблем направлена деятельность международной организации World Wide Web Consortium (W3C) в рамках ее проекта "Semantic Web". Реализация этого проекта подразумевает перенос технологий инженерии знаний [1] в Интернет и, соответственно, создание распределенной базы знаний мирового масштаба. На данный момент W3C разработано две базовых модели и формата для представления знаний в Semantic Web - Resource Description Framework (RDF) [2] и Ontology Web Language (OWL) [3].

Модель RDF является аналогом семантической сети и включает также в себя XML-формат для хранения RDF-данных. Базовыми понятиями RDF являются ресурсы, отношения, также называемые предикатами и свойствами, и утверждения, представляющие собой триаду "ресурс-субъект - отношение - ресурс-объект или литерал". OWL - это модель на базе RDF в виде набора выделенных терминов, базовыми понятиями которой являются класс, свойство и экземпляр класса. Формализованная модель предметной области в виде совокупности терминов и отношений между ними называют онтологией, поэтому язык OWL и называют языком онтологий.

Языки RDF и OWL сейчас обычно позиционируются как языки для описания веб-страниц, для обработки их поисковыми системами и прочими интеллектуальными программными агентами. Автором предлагается использовать OWL онтологии также для адекватного представления предметной области различного рода информационных веб-ресурсов - учебных, научных, познавательных, технических и проч. Статус рекомендации W3C и наличие готовых интероперабельных программных решений делают технологию Semantic Web более привлекательной, чем другие технологические решения инженерии знаний.

В предлагаемой технологии автор выделяет следующие этапы:

  1. Разработка онтологии предметной области: создание иерархии классов, свойств, отношений между классами, их характеристик [4]. На данном этапе можно использовать так называемые редакторы онтологий (например, разработку Стэндфордского университета "Protege" [7]).
  2. Наполнение онтологии данными, или, другими словами, наполнение базы знаний. Многие редакторы онтологий позволяют выполнить и данный этап.
  3. Разработка структуры веб-ресурса в виде онтологии и соответствующей базы знаний. Здесь могут быть определены такие понятия, как раздел, меню и др.
  4. Реализация шаблонов для визуализации базы знаний. Желательна возможность применения стандартных или созданных ранее шаблонов оформления.

Для работы данной технологии, требуется некоторая среда, которая бы связывала разработанные базы знаний и шаблоны в единый работающий веб-ресурс. Автор ведет разработку подобной среды [10] на основе технологий Java Servlets и Java Server Pages путем реализации обрабатываемых на стороне сервера дополнительных тэгов, объектов и функций языка выражений для JSP. На данный момент реализована возможность создания шаблонов с применением запросов к базе знаний на языках запросов RDQL [8] и BRQL [9], возможность получения свойств объектов с использованием операции точки (подобно получению значений полей в объектно-ориентированных языках), реализован ряд вспомогательных функций (в частности, для работы с RDF списками). Также расширена функциональность библиотеки Jena [6] для импорта онтологий не только из файлов и веб-ресурсов, но и из реляционных баз данных.

Интероперабельность информации является важнейшим свойством Semantic Web. Объединение OWL онтологий осуществляется простым объединением списков утверждений, поэтому для интеграции веб-ресурсов необходимо выполнение лишь следующих требований: 1) публикация онтологий в Интернет для свободного доступа, 2) стандартизация и повторное использование существующих онтологий, 3) использование средств OWL для соотнесения понятий разных онтологий. Важным шагом на пути к интероперабельности ресурсов в Semantic Web будет создание стандартного языка запросов к RDF-хранилищам, работа над которым ведется в W3C.

В качестве примера применения предлагаемой технологии можно привести реализацию веб-представительства вуза на основе стандартизированной, принятой общественностью онтологии, за основу которой можно взять [5]. Использование готовой онтологии позволит разработчикам непосредственно приступить к заполнению данных и построению шаблонов и дизайна. В случае открытой публикации RDF-данных возможна реализация программных агентов для поиска этих данных (к примеру, с помощью специальных запросов системы Google), агрегация в едином хранилище и предоставление данных пользователям (например, абитуриентом) в едином интерфейсе со специфическими функциями. Могут быть просто интегрированы данные подразделений и представительств вуза, которые редактируются редактором онтологий на местах и импортируются с основного веб-сайта вуза. В случае интеграции достаточно больших и часто меняющихся распределенных данных (например, для агрегации информации о конференциях региона с веб-представительств вузов и научных организаций), возможно использование RDF-хранилищ с открытыми интерфейсами для выборки только необходимых данных (например, Joseki RDF Server [6]).

ИСПОЛЬЗУЕМАЯ ЛИТЕРАТУРА
  1. Гаврилова В.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб.: Питер, 2001.
  2. RDF Primer. W3C Recommendation 10 February 2004.
  3. OWL Web Ontology Language: Guide. W3C Recommendation 10 February 2004.
  4. Natalya F. Noy and Deborah L. McGuinness. Ontology Development 101: A Guide to Creating Your First Ontology. March 2001.
  5. Ian Horrocks. Knowledge acquisition. // http://protege.stanford.edu/plugins/owl/owl-library/ka.owl
  6. HP Labs Semantic Web Research. // http://www.hpl.hp.com/semweb/
  7. Protege is an ontology editor and a knowledge-base editor. // http://protege.stanford.edu/
  8. Andy Seaborne. RDQL - A Query Language for RDF. 2004. // http://www.w3.org/Submission/RDQL/
  9. Dave Beckett, Chris Dollin, Nicholas Gibbins, Steve Harris, Andy Seaborne, Damian Steer. BRQL. A Query Language for DAWG. 2004. // http://jena.hpl.hp.com/~afs/BRQL.html
  10. Бархатов А.В. SemWebsite. // http://semweb.krasu.ru/SemWebsite/

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск