Бурное развитие молекулярной биологии и генетики привело к созданию большого числа баз данных. В результате этого информация о свойствах какого-либо биологического объекта разнесена по большому числу взаимодополняющих баз данных. Для того, чтобы можно было собрать воедино информацию о заданном биологическом объекте, многие из этих баз данных интегрированы друг с другом на уровне перекрестных ссылок. Однако, данная интеграция весьма поверхностна: только эксперт-биолог может сопоставить, взаимодополнить и взаимопроверить информацию о заданном объекте из разных баз данных.
Нами разработан принципиально новый подход к более глубокой интеграции биологических баз данных, позволяющий сопоставлять, взаимодополнять и взаимопроверять информацию о заданном объекте из разных баз данных в автоматическом режиме. В основе этого подхода лежит представление информации из баз данных в виде набора объектов, и последующий семантический анализ взаимоотношений между этими объектами.
Данный подход применяется для интеграции баз данных EMBL, TRRD, TRANSFAC, EPD, SWISS-PROT, PDB и GeneNet. Для этого разработана библиотека классов, соответствующих основным молекулярно-биологическим понятиям, информация о которых представлена в этих базах данных. Для семантического анализа информации построен набор правил и метаправил. Для управления поиском и анализом информации, а так же для ее графического представления нами разрабатывается специализированный объектно-ориентированный язык высокого уровня.
Работа осуществляется при поддержке грантов РФФИ 99-07-90203, 98-07-91078э.
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии А.М.Федотов |
[Головная страница] [Конференции] [СО РАН] |
© 1999, Сибирское отделение Российской академии наук, Новосибирск