Информационная система "Конференции"


IV Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям

3-5 ноября 2003 г., г. Красноярск, Академгородок

Поддержка информационных ресурсов для научных исследований в области математических наук.

Котенков М.В., Караханов А.С.
Институт вычислительных технологий СО РАН, Новосибирск

Аннотация.

Целью создания системы является упрощение работы по ведению систематизированной коллекции ресурсов произвольного содержания. Система предназначена для работы с коллекциями ресурсов в области математических наук. Система позволяет пользователю сосредоточиться только на классификации ресурсов, оставляя за собой размещение, учет, поиск ресурсов в глобальной сети. В задачи системы входит обеспечение целостности структуры каталога, организация поиска в каталоге по определенным полям, выполнение глобального поиска по ключевым терминам с предварительной классификацией, поддержка актуальности ресурсов каталога, организация доступа к системе по привилегиям.

Структура. Основные части. Функциональные блоки.

На абстрактном уровне можно поделить структуру системы на две части. Первая часть отвечает за функционирование системы - "системная" часть. В нее входят мета-описание "пользовательской" части, системные словари, функционал. Вторая часть, "пользовательская", содержит данные пользователя - это каталог ресурсов, личные настройки параметров работы с системой. При интеграции в систему каталоги-участники должны быть приведены к определенному виду, так как в системе не реализован механизм описания ссылок внутри базы каталога-участника.

Системная часть состоит из таблиц представляющих мета-описание каталогов.

В пользовательскую часть входят таблицы, отвечающие за каталог и список ресурсов :

Подобная организация системы позволяет объединить данные из различных СУБД. Для этого структура каталогов-участников описывается при помощи мета-описания, указывается драйвер СУБД, используемый для доступа. На данном этапе развития системы информация каталога-участника должна быть представлена в виде одной таблицы, содержащей всю необходимую информацию по ресурсам. Мета-описание такой таблицы будет содержать список колонок с информацией о том, как работать с данными колонки.

Системный функционал выполняет задачи поиска информации во всемирной сети по заданному набору параметров, предварительную классификацию, уведомление пользователя выбранным способом, поддержку ресурсов в актуальном состоянии.

Поиск начинается с заданного стартового адреса путем анализа ссылок на странице. Ссылки делятся на локальные и глобальные, из рассмотрения исключаются ссылки, которые были уже обработаны. Локальные ссылки указывают на страницы на том же сервере, что и базовый адрес. Далее, среди локальных ссылок выделяются только статические адреса, то есть ссылки на динамически формируемые страницы отбрасываются. Затем статическая страница поступает на тематический анализ. После того, как все статические страницы текущего шага пройдут тематический анализ, по ним запускает следующий виток поиска. Среди параметров поиска можно задавать глубину обхода ссылок относительно начального адреса.

Тематический анализ страницы заключается в поиске на ней заданных ключевых слов, затем определяется преобладающее множество слов и производится классификация ресурса. Если система не может однозначно разрешить принадлежность страница к одному из элементов каталога, то такое решение остается за пользователем.

Для классификации система использует тезаурус. На текущем этапе тезаурус представляет собой линейный список ключевых слов.

О результатах поиска система уведомляет пользователя посредством электронной почты, кроме того, включение найденных ресурсов в каталог не происходит без подтверждения корректности классификации со стороны пользователя-эксперта.

Все ресурсы, находящиеся в каталоге поддерживаются в актуальном состоянии. Механизм актуализации регулярно проверяет доступность ресурса, и, при включении соответствующей опции, принадлежность все той же категории каталога.

Работа пользователя.

Работа пользователя с системой происходит через Web-browser посредством динамически генерируемых страниц. Система имеет гибкий механизм для организации доступа пользователей, который позволяет формировать права вплоть до конкретного ресурса.
Интерфейс системы позволяет:

Заключение.

Структура системы обеспечивает наличие нескольких тезаурусов вплоть до подключения пользовательских словарей и, таким образом, позволяет применять систему в различных областях наук.

Система доступа дает возможность максимально использовать WEB-доступ, одновременно надежно разделяя информацию по привилегиям.


Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск