Сибирское отделение РАН 
Институт цитологии и генетики



Первое международное рабочее совещание "Биоразнообразие и динамика экосистем Северной Евразии: информационные технологии и моделирование" (WITA-2001)

9-14 июля 2001 года, Новосибирск, Россия

Тезисы докладов


Генетические основы биоразнообразия

Новая версия банка образов белковых семейств PROF_PAT 1.7.

Бачинский А.Г.1*, Григорович Д.А.2, Наумочкин А.Н.1, Низоленко Л.Ф.1, Ярыгин А.А.1

ГНЦ ВБ "Вектор" (Кольцово),
Институт Цитологии и Генетики СО РАН (Новосибирск)

Базы данных паттернов стали важными инструментами для идентификации отдаленного сходства последовательностей, и следовательно, для предсказания функции белка и его структуры.. Были разработаны технология и программное обеспечение для построения образов семейств белков. С их использованием построен банк образов семейств белков PROF_PAT 1.3.. Этот банк основан на аминокислотных последовательностях SWISS-PROT (rl. 38) и TrEMBL (rl. 11) и содержит образы (паттерны) более чем 14000 групп родственных белков в формате, близком к PROSITE. Отбирались мотивы паттернов, которые имели минимальный уровень вероятности, быть обнаруженными в случайных последовательностях. Банк сопровождает гибкая быстрая программа поиска. Исследователь может определить матрицу сходства/различий для аминокислотных остатков (типа PAM, BLOSUM и др.). Можно также задавать минимальный уровень сходства, что определяет стратегии поиска от точных совпадений до отдаленной гомологии. Тысячи аминокислотных последовательностей могут быть обработаны и идентифицированы в течение нескольуих минут.

Для полного использования потенциала PROF_PAT необходимо его обновлять с каждой новой версией порождающих банков SWISS-PROT + TrEMBL. Для этого разработана автоматизированная процедура, так что новая версия PROF_PAT появляется примерно через месяц после появления новых версий SWISS-PROT или TrEMBL. Последняя версия банка, основанная на 320 000 полных последовательностей SWISS-PROT (rl.39) и TrEMBL (rl.16), содержит образы более чем 27,000 групп родственных белков. Общее число мотивов в паттернах равно 431062, их суммарная длина – 4241824 позиций, по сравнению с более чем 57 000 000 позиций белков, входящих в семейства PROF_PAT.

Банк PROF_PAT размещен на сервере Института Цитологии и Генетики СО РАН (http://wwwmgs.bionet.nsc.ru/mgs/programs/prof_pat/, Новосибирск, РФ), его локальная версия доступна анонимному пользователю на FTP серверах: (ftp://ftp.bionet.nsc.ru/pub/biology/vector/prof_pat/, ИЦиГ, Новосибирск, РФ), и (ftp://ftp.ebi.ac.uk/pub/databases/prof_pat/, Европейский Институт Биоинформатики, Хинкстон, Великобритания).

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICG SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск
    Дата последней модификации: 06-Jul-2012 (11:44:54)