|
Сибирское отделение РАН |
Генетические основы биоразнообразия
Расшифровка последовательностей геномов является только первым шагом в изучении генетических систем.
Один из следующих шагов, наряду с определением возможных функций потенциальных белков, - предсказание внутри- и/или внеклеточной локализации этих белков.
Известные в Интернет ресурсы, делающие такие предсказания дают достаточно много ошибок, поэтому встал вопрос о создании новой системы.
ProtComp предназначен для анализа последовательностей эукариотов и сочетает в себе несколько методов предсказания.
Тестируемая последовательность сравнивается со всеми белками банка SWISS-PROT, для которых известна локализация. Сравнение производится двумя способами: с помощью известного алгоритма BLASTA, и с использованием паттернов специально сконструированного банка, выполненного по технологии PROF_PAT (http://wwwmgs.bionet.nsc.ru/mgs/programs/prof_pat/).
Система предсказывает наличие сигнальных и других последовательностей (signal-anchors, mitochondrial and chloroplast transit peptides, transmembrane segments) с использованием технологии нейронных сетей, а также мотивов, характерных для белков определенных локализаций. Кроме того, определяется заряд доменов, находящихся между трансмембранными сегментами (или, соответственно, N- и C-концов последовательности), что позволяет судить о мембранной топологии белка.
Нейронные же сети классифицируют белки по следующим компартментам: Цитоплазма, Эндоплазматический ретикулум, Плазматическая мембрана, Ядро, Внеклеточные (Секретируемые), Митохондрии, Хлоропласты (только для белков растений), Пероксисомы, Аппрат Гольджи и Лизосомы (только для белков животных и грибов).
На основе результатов всех этих подсистем формируется интегральный показатель, который и определяет предсказание (Табл. 1).
ProtComp тестировался на последовательностях TrEMBL, не вошедших в обучающие выборки. Результаты представлены в Табл. 2.
Ресурс доступен анонимным пользователям на сервере http://www.softberry.com.
Табл. 1. Пример вывода системы предсказания локализации белков ProtComp.
Табл. 2. Результаты тестирования ProtComp на последовательностях TrEMBL с известной локализацией.
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск
Дата последней модификации: 06-Jul-2012 (11:44:54)