IV рабочее совещание по электронным публикациям - EL-PUB-99

Новосибирск, Академгородок, ИВТ СО РАН, 21 - 23 апреля 1999 года.

Тезисы докладов


Классификация информации, характеризующей пространственную структуру и биологическую функцию макромолекул и ее представление в системе ГЕНЭКСПРЕСС

Иванисенко В.А., Григорович Д.А., Фролов А.С., Пономаренко М.П., Подколодный Н.Л., Колчанов Н.А.

Институт Цитологии и Генетики СО РАН (Новосибирск)

Первоначально база данных PDB была сконструирована для накопления основополагающей информации по третичным структурам макромолекул. В период ее создания задача автоматизированного поиска и доступа к информации не была актуальной, поскольку число расшифрованных структур было невелико. Поэтому структура базы данных была выбрана в виде одна макромолекула - один файл, которая, в то время, наиболее полно удовлетворяла основным требованиям. За последние несколько лет произошел качественно новый скачок техники синтеза, выделения и кристаллизации биологических макромолекул, что повлекло крайне резкое увеличение числа расшифрованных структур. В настоящее время число таких структур достигло более 9000 и продолжает расти в геометрической прогрессии. Таким образом, перед исследователями встала задача трансформирования PDB в базу данных, удовлетворяющую также и требованиям современных компьютерных технологий хранения, поиска и доступа к информации. Разработка такой базы обязывает провести классификацию информации и выделение в ней ключевых данных, необходимых для поиска и характеризации объектов.

К числу макромолекул, реферируемых в PDB, относятся как отдельные белки, так и их комплексы с другими молекулами, в том числе не белковой природы. Описание макромолекул отражает широкий спектр характеристик экспериментов по биологическому и химическому синтезу, описание биологической функции на молекулярном, клеточном и организменном уровне, коллекцию координат атомов, входящих в состав макромолекул и многие другие функциональные и структурные характеристики. Проведенный нами анализ позволил выделить ряд основных критериев классификации такой информации. С использованием данных критериев информация была сгруппирована и преобразована на однородные формализованные классы, несущие поисковую, поисково-информационную и чисто информационную нагрузку. С помощью интеграции различных типов характеристик макромолекул разработаны новые информационные классы, позволяющие расширить поисковые возможности системы. Результаты анализа положены в основу при создании структуры и формата PDB, адапаптированного для эффективного поиска и интеграции в системе ГЕНЭКСПРЕСС.

Примечание. Тезисы докладов публикуются в авторской редакции



|Электронная библиотека| |Математические публикации| |Информационные ресурсы|
Ваши комментарии
А.М.Федотов
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 1999, Сибирское отделение Российской академии наук, Новосибирск