Архитектура коллекции знаний об Онежском и Ладожском озерах

В.А. Лебедев*, С.В. Брагин*, В.Г. Старкова*,

Н.Н. Филатов**, В.В. Кекконен**

* Институт прикладных математических исследований

** Институт водных проблем Севера,

Карельского научного центра РАН

Онежское и Ладожское озера являются крупнейшими пресноводными водоемами Европы, содержат вековые запасы пресной воды высокого качества, играют важную роль в экономике и сохранении редких видов животных и растений [1,2].

Цели создания коллекции состоят в обеспечении поддержки исследований и выработки рекомендаций по рационализации водного хозяйства и охране крупнейших озер Европы, обучения студентов и аспирантов на основе систематизации цифрового представления знаний по изученности этих водоемов, проблемам и средствам их решения, т.е. коллекция является электронной энциклопедией знаний об этих водоемах. Она должна: обеспечить полноту, непротиворечивость и доступность знаний в локальной, корпоративной и отчасти в глобальной сети; учитывать особенности предметной области, как-то: многодисциплинарность, сложность и разветвленность системы понятий, большую мощность и разнотиповость множеств объектов, распределенных в пространстве, и динамический характер знаний.

Чтобы обеспечить полноту коллекции, необходимо привлечь знания по геологии, климатологии, географии, гидрологии, гидрохимии, гидробиологии, ихтиологии, токсикологии и др. научным дисциплинам. Содержанием коллекции будут понятия, объекты, их классы и взаимодействия, множества которых и их отношения целесообразно отобразить в структуре знаний в виде ациклического графа, вершины которого обозначены терминами и названиями, а дуги отображают структурообразующие отношения: классификации (род-вид), агрегации (целое-часть), равнозначности (синонимии). Этот граф в силу его общности может отображать композиции различных классификаторов и рубрикаторов на множестве фрагментов знаний.

Формы представления знаний в коллекции – это тексты (возможно иллюстрированные), географические карты, базы данных, программы решения задач, космические снимки, библиографии и др. Количество информационных объектов (документов) может исчисляться тысячами, поэтому возникает проблема доступности знаний, которая может быть решена созданием базы метаинформации, обеспечивающей доступ к конкретным документам.

В основу метаинформации положен граф структуры знаний. Верхние уровни структуры знаний – климат, водоемы, водотоки, водосборы, подземные воды, водное хозяйство. В частности, абиотическая среда водоемов будет характеризоваться физико-географическим описанием, водным балансом, уровнем и их изменчивостью, термическим режимом, течениями, поступлением и выносом химических веществ, динамикой химсостава вод по акваторям (зонам, заливам), физико-химическим описанием донных отложений, влиянием климатических и антропогенных воздействий.

База метаинформации строится на основе представления графа структуры знаний в виде пары: множества помеченных вершин и множества дуг, обозначенных названиями смежных вершин. В качестве помет назначены: понятие типа вершины, типа знаний, связанных с вершиной, комментарии, ключевые слова, связи с географической картой. Реализована база метаинформации в виде реляционной базы данных, состоящей из нескольких таблиц. Здесь показан фрагмент таблицы, отображающей названия вершин-листьев, пути, имена и форматы соответствующих документов, связи их с географической картой и задачами.

 В зависимости от типа и формата документа после его вызова выбирается та или иная программа манипулирования и визуализации. Все это дает следующие преимущества по сравнению с традиционным представлением графов в виде двоичных или троичных деревьев:

● Открыт прямой доступ к любой вершине графа (т.е. не требуется прохождение путей только от корневых вершин, облегчена доступность).

● Достаточно просто контролируется целостность базы данных (в частности, связанность графа).

● Достаточно просто вносятся изменения и дополнения в структуру знаний и в коллекцию, т.е. обеспечен импорт новых понятий и знаний и удаление устаревших (т.е. динамичность).

Таким образом, реализация графа структуры знаний является базой метаинформации, обеспечивающей как накопление знаний, так и доступ к ним. На этой основе разработаны архитектура и программное обеспечение научных коллекций по экологии [3,4].

Архитектура системы упрощенно показана на рисунке. В качестве хранилища знаний используется жесткий диск сервера, обслуживаемый файловой системой. Структуру знаний и базы данных обслуживает прикладной модуль, на основе объектно-реляционной технологии. Часть операций по импорту и доступу в локальной сети выполняется на клиентских компьютерах или консоли администратора. При этом часть знаний коллекции может быть распределена на компьютерах, включенных в локальную сеть. В частности, пользователи могут создавать на своих компьютерах свои личные коллекции и использовать их совместно с общей, например, создавая виртуальные базы данных. Личные коллекции не доступны в локальной сети, но могут быть открыты как удаленные представления.

Вся или часть коллекции через CGI – шлюз может быть объявлена на Web-сервере и открыта в интернет или интранет (за пределами локальной сети). Доступ к коллекции в этом случае осуществляется через специальные формы Web-сайта. Для работы удаленного клиента с географическими картами Web-браузер должен быть снабжен геоинформационным модулем. Файлы карт к нему передаются в протоколе ftp [5].

В коллекцию могут быть включены удаленные информационные ресурсы указанием их URL в структуре знаний. Для восприятия этих ресурсов клиенты локальной сети должны иметь выход в интернет/интранет (на рис. не показаны).

Пользователи коллекции получают возможность доступа к ресурсам коллекции посредством поиска документов по названиям, набирая первые буквы названий или указывая их ключевые слова. Можно искать документы по ключевым словам их содержания. Наконец, можно вызвать карту и, указывая на ней объекты, получать различные аспекты их описания. Кроме чтения и печати, система позволяет пользователям выполнять геоинформационные функции и обработку данных.

Для удобства пользования коллекцией разработана система интерфейса, включающая около 50 оконных меню, охватывающих все функциональные возможности системы.

 

 

 

Литература

[1] Онежское озеро. Экологические проблемы. Ред. Филатов Н.Н. Петрозаводск, 1999.

[2] Ладожское озеро. Ред. Филатов Н.Н. Петрозаводск, 2000.

[3] Лебедев В.А. О методике построения электронных коллекций знаний. //Труды Института прикладных математических исследований, вып. 2. Петрозаводск, 2000.

[4] Лебедев В.А., Старкова В.Г., Брагин С.В. Система доступа к коллекции знаний по экологии региона. //Труды Второй Всероссийской научной конференции “Электронные библиотеки: перспективные методы и технологии, электронные коллекции”. Протвино, 2000.

[5] Лебедев В.А., Филатов Н.Н. Коллекции знаний для Интернет о крупнейших озерах Европы: Ладожское и Онежское. //Тезисы докладов Международной конференции “Интернет и общество”. С.-Петербург, 2000.