Конференции ИВТ СО РАН



VII Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям (с участием иностранных ученых)

1-3 ноября 2006 года, Красноярск, Россия

Тезисы докладов


Информационные технологии

Об интеграции разнородных каталогов сотрудников СО РАН

Гуськов А.Е.

Институт вычислительных технологий СО РАН (Новосибирск)

В настоящее время в большинстве организаций СО РАН ведутся электронные каталоги содержащие, с разной степенью детализации, информацию о своих сотрудниках. Существуют и другие тематические каталоги – каталоги участников конференций, авторов публикаций в различных изданиях и др. Следует отметить разнородность этих каталогов: для их хранения используются различные СУБД (MySQL, Postgres, MS Access, Oracle и др.) и платформы (MS Windows, Linux, FreeBSD и др.). Кроме этого, большинство каталогов имеют собственные схемы данных, которые не согласованы со стандартными и рекомендованными схемами.

Также выделим две попытки создания общего каталога сотрудников СО РАН. В рамках одной из них была создана информационно-справочная система «Организации и сотрудники СО РАН» (http://www.nsc.ru/sbras/db). Система обладает пользовательским web-интерфейсом, который предназначен для ввода и редактирования персональных сведений ответственными лицами (как в рамках отдельной организации, так и по региональным центрам СО РАН). К основным недостаткам этой системы следует отнести несогласованность внутренней схемы данных каталога и, как следствие, отсутствие стратегии интеграции с подобными внешними системами.

Альтернативный каталог сотрудников также представлен в «Распределенной информационной системе СО РАН» (http://db.nsc.ru:210). Этот каталог был создан на основе сервера ZooPARK, реализующего функциональность протокола Z39.50 (ISO-23950). В качестве схемы данных была выбрана стандартизованная схема, описанная в протоколе LDAP (Lightweight Directory Access Protocol), что предоставит достаточно широкий спектр возможностей для интеграции с внешними системами.

К недостаткам реализации обеих систем следует отнести отсутствие организационных и технических решений для координации работы и взаимодействия с другими каталогами. В настоящее время ни одна система не оснащена средствами получения/отправки актуальных сведений из/для внешних систем (репликации данных), средствами контроля актуальности информации, средствами соотнесения сведений об одном человеке в различных каталогах.

Очевидно, что наиболее проблемным вопросом является приведение разнородных систем к единому формату взаимодействия, т.е. к единому протоколу обмена и к согласованной схеме данных.

В рамках пилотного проекта по интеграции каталогов сотрудников СО РАН предлагается создание единой системы, выполняющей функцию аккумуляции электронных ресурсов о сотрудниках. Ее отличительной чертой является то, что данная система будет предоставлять пользователям, прежде всего, не исчерпывающую информацию о каждой персоне, а набор ссылок, где эту информацию в том или ином объеме можно получить. В качестве основного протокола взаимодействия с другими системами следует использовать протокол Z39.50, а в качестве унифицированной схемы данных – модель персоны LDAP.

В результате, подключение нового каталога к системе (интеграция) будет сводиться к настройке еще одного сервера Z39.50 и формализованному описанию соответствия между полями каталога и схемой данных LDAP. Отметим, что в результате этих действий новый каталог наравне с другими аналогичными каталогами попадет в общий реестр, по которому будет возможным выполнение распределенных поисковых запросов согласно идеологии Z39.50. Таким образом, возможно получить единый каталог сотрудников СО РАН, интегрирующий множество распределенных разнородных каталогов. Одним из достоинств данного подхода является возможность интеграции существующих каталогов без изменений в структуре их данных и программном коде.

В связи с реализацией этого проекта возникает ряд перспективных исследовательских задач, таких как: поиск записей об одной и той же персоне, проверка модификации записи о персоне (актуализация). Отдельного внимания заслуживает задача сопоставления персонам интегрированного каталога других сведений, таких как авторские публикации, проекты с участием персоны, организации и т.д.

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск