BLAST

BLAST
BLAST
Тип

Биоинформатика

Разработчик

Altschul S.F., Gish W., Miller E.W., Lipman D.J., NCBI

Операционная система

UNIX, Linux, Apple Macintosh, Microsoft Windows

Последняя версия

2.2.24 (08.08.2010)

Лицензия

Public Domain

Сайт

FTP сервер NCBI

BLAST (англ. Basic Local Alignment Search Tool) — семейство компьютерных программ, служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или её фрагмент. Используя BLAST, исследователь может сравнить имеющуюся у него последовательность с последовательностями из базы данных и найти последовательности предполагаемых гомологов. Является важнейшим инструментом для молекулярных биологов, биоинформатиков, систематиков.

Содержание

Классификация программ серии BLAST

Семейство программ серии BLAST делится на 5 основных групп:

Нуклеотидные

предназначены для сравнения изучаемой нуклеотидной последовательности с базой данных секвенированных нуклеиновых кислот и их участков:

  • megablast — быстрое сравнение с целью поиска высоко сходных последовательностей,
  • dmegablast — быстрое сравнение с целью поиска дивергировавших последовательностей, обладающих незначительным сходством,
  • blastn — медленное сравнение с целью поиска всех сходных последовательностей и др..

Белковые

предназначены для сравнения изучаемой аминокислотной последовательности белка с имеющейся базой данных белков и их участков.

  • blastp — медленное сравнение с целью поиска всех сходных последовательностей,
  • cdart — сравнение с целью поиска гомологичных белков по доменной архитектуре,
  • rpsblast — сравнение с базой данных консервативных доменов,
  • psi-blast — сравнение с целью поиска последовательностей, обладающих незначительным сходством,
  • phi-blast — поиск белков, содержащих определённый пользователем паттерн и др.

Транслирующие

способны транслировать нуклеотидные последовательности в аминокислотные:

  • blastx — переводит изучаемую нуклеотидную последовательность в кодируемые аминокислоты, а затем сравнивает её с имеющейся базой данных аминокислотных последовательностей белков,
  • tblastn — изучаемая аминокислотная последовательность сравнивается с транслированными последовательностями базы данных секвенированных нуклеиновых кислот,
  • tblastx — переводит изучаемую нуклеотидную последовательность в аминокислотную, а затем сравнивает её с транслированными последовательностями базы данных секвенированных нуклеиновых кислот.

Геномные

предназначены для сравнения изучаемой нуклеотидной последовательности с базой данных секвенированного генома какого-либо организма (человека, мыши и др.)

Специальные

прикладные программы, использующие BLAST:

  • bl2seq — сопоставление двух последовательностей по принципу локальных выравниваний,
  • VecScreen — определение сегментов нуклеотидной последовательности нуклеиновой кислоты, которые могут иметь векторное происхождение и др.

Принципы работы BLAST

Все выравнивания принято делить на глобальные (последовательности сравниваются полностью) и локальные (сравниваются только определённые участки последовательностей). Программы серии BLAST производят локальные выравнивания, что связано с наличием в различных белках сходных доменов и паттернов. Кроме этого локальное выравнивание позволяет сравнить иРНК с геномной ДНК. В случае глобального выравнивания обнаруживается меньшее сходство последовательностей, особенно их доменов и паттернов.

После введения изучаемой нуклеотидной или аминокислотной последовательности (запрос) на одну из веб-страниц BLAST, она вместе с другой входной информацией (база данных, размера «слова» (участка), значение величины E и др.) поступает на сервер. BLAST создаёт таблицу всех «слов» (в белке — это участок последовательностей, который по умолчанию состоит из трёх аминокислот, а для нуклеиновых кислот из 11 нуклеотидов) и сходных «слов».

Затем в базе данных проводится их поиск. Когда обнаруживается соответствие, то делается попытка продлить размеры «слова» (до 4 и более аминокислот и 12 и более нуклеотидов) сначала без гэпов (пробелов), а затем с их использованием. После максимального продления размеров всех возможных «слов» изучаемой последовательности, определяются выравнивания с максимальным количеством совпадений для каждой пары запрос — последовательность базы данных, и полученная информация фиксируется в структуре SeqAlign. Форматер, расположенный на сервере BLAST, использует информацию из SeqAlign и представляет её различными способами (традиционным, графическим, в виде таблицы).

Для каждой обнаруженной в базе данных программами BLAST последовательности необходимо определить, насколько она сходна с изучаемой последовательностью (запрос) и значимо ли это сходство. Для этого BLAST вычисляет число битов и величину Е (expected value, E-value) для каждой пары последовательностей.

При определении сходства ключевым элементом является матрица замен, так как она определяет показатели сходства для любой возможной пары нуклеотидов или аминокислот. В большинстве программ серии BLAST используется матрица BLOSUM62 (Blocks Substitution matrix 62 % identity, блоковая матрица замен с 62 % идентичности). Исключением являются blastn и megablast (программы, которые выполняют нуклеотид — нуклеотидные сравнения и не используют матрицы аминокислотных замен).

С помощью модифицированных алгоритмов Смита-Уотермана или Селлерса определяются все пары сегментов (продленные «слова»), которые нельзя увеличить, так как это приведёт к уменьшению показателей сходства. Такие пары продленных «слов» называются парами сегментов с максимальным сходством (high-scoring segment pairs, HSP). В случае достаточно большой длины изучаемой последовательностей (m) и последовательности базы данных (n) показатели сходства HSP характеризуются двумя параметрами K (размера области поиска) и P (системы подсчёта). Эти показатели необходимо указывать при приведении показателей сходства изучаемой последовательности и последовательности базы данных (S).

Для сравнения показателей сходства различных выравниваний независимо от используемой матрицы, их необходимо преобразовать. Для получения преобразованного показателя сходства (числа битов, B) используют формулу:

B = (P\cdot S - \ln{K})/\ln{2}

Величина B показывает, насколько сходны последовательности (чем больше число битов, тем больше сходство). Так как в формулу расчёта B заложены показатели К и P, то нет необходимости указывать их при приведении значений B. Величина E (Е-value), соответствующая показателю B, показывает достоверность данного выравнивания (чем ниже значение E, тем достовернее выравнивание). Она определяется по формуле:

E = m\cdot n\cdot 2 - B

Программы BLAST преимущественно определяют значение E, а не P (вероятности наличия хотя бы одного HPS с показателем, превышающим или равным S). Но при E < 0,01 значения P и E почти идентичны.

Величина E определяется по формуле (2) при сравнении лишь двух аминокислотных или нуклеотидных последовательностей. Сравнение изучаемой последовательности длиной m с множеством последовательностей базы данных может основываться на двух положениях. Первое положение состоит в том, что все последовательности базы данных одинаково сходны с изучаемой. Это подразумевает, что значение E для выравнивания с короткой последовательностью, содержащейся в базе данных, следует приравнять со значением E для выравнивания с длинной последовательностью. Для вычисления значения E по базе данных необходимо умножить значение E, полученное при попарном сравнении, на число последовательностей в ней. Второе положение заключается в том, что изучаемая последовательность более сходна с короткими, а не с длинными последовательностями, потому что последние часто состоят из различных участков (многие белки состоят из доменов). Если предположить, что вероятность сходства пропорциональна длине последовательности, то попарное значение E для последовательности базы данных длиной n надо умножить на N/n, где N — общая длина аминокислот или нуклеотидов в базе данных. Программы BLAST преимущественно используют этот подход для вычисления значений E по базе данных.

Теоретически локальное выравнивание может начинаться с любой пары нуклеотидов или аминокислот выровненных последовательностей. Однако HPS, как правило, не начинаются близко к краю (началу или концу) последовательностей. Для коррекции такого краевого эффекта необходимо вычислять эффективную длину последовательностей. В случае последовательностей длиной более 200 остатков происходит нейтрализация краевого эффекта.

См. также

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "BLAST" в других словарях:

  • blast — blast; blast·er; blast·ie; blast·man; blast·ment; brach·y·blast; car·dio·blast; ce·ment·o·blast; chon·dro·blast; chro·mo·blast; cni·do·blast; coe·lo·blast; coe·no·blast; col·lo·blast; coun·ter·blast; cryp·to·blast; crys·tal·lo·blast; cy·to·blast; …   English syllables

  • BLAST — Saltar a navegación, búsqueda BLAST Desarrollador Altschul S.F., Gish W., Miller E.W., Lipman D.J., NCBI http://www.ncbi.nlm.nih.gov/BLAST/ Información general …   Wikipedia Español

  • Blast — (bl[.a]st), n. [AS. bl[=ae]st a puff of wind, a blowing; akin to Icel. bl[=a]str, OHG. bl[=a]st, and fr. a verb akin to Icel. bl[=a]sa to blow, OHG. bl[^a]san, Goth. bl[=e]san (in comp.); all prob. from the same root as E. blow. See {Blow} to… …   The Collaborative International Dictionary of English

  • BLAST — bezeichnet: eine junge, nicht endgültig differenzierte Zelle, siehe Blast (Biologie) einer britische Literaturzeitschrift, siehe Blast (Zeitschrift) einen Actionfilm, siehe Blast – Dem Terror entkommt niemand BLAST steht für: Basic Local… …   Deutsch Wikipedia

  • blast — /blast / (say blahst) noun 1. a sudden blowing or gust of wind. 2. the blowing of a trumpet, whistle, etc. 3. the sound produced by this. 4. a forcible stream of air from the mouth, from bellows, or the like. 5. Metallurgy air under pressure… …  

  • Blast! — may refer to:* Blast! , a mild English language (primarily British) expletive * Blast! (1972 film), a.k.a. The Final Comedown * Blast! (2004 film), an action/comedy/thriller film * Blast! (comic), a 1991 British comic * Blast! (musical), a 2001… …   Wikipedia

  • blast — n blight, nip (see under BLAST vb) Analogous words: destruction (see corresponding verb at DESTROY): extermination, extirpation, wiping out (see corresponding verbs at EXTERMINATE): ruin, wreck (see RUIN vb) blast vb Blast, blight, nip mean as… …   New Dictionary of Synonyms

  • Blast — Blast, v. t. [imp. & p. p. {Blasted}; p. pr. & vb. n. {Blasting}.] 1. To injure, as by a noxious wind; to cause to wither; to stop or check the growth of, and prevent from fruit bearing, by some pernicious influence; to blight; to shrivel. [1913… …   The Collaborative International Dictionary of English

  • blast — [blast, bläst] n. [ME < OE blæst, puff of wind < IE * bhlē , var. of base * bhel , to swell, blow up > BALL1, L flare] 1. a gust of wind; strong rush of air 2. the sound of a sudden rush of air or gas, as through a trumpet 3. a strong,… …   English World dictionary

  • Blast — bezeichnet: eine junge, nicht endgültig differenzierte Zelle, siehe Blast (Biologie) eine britische Literaturzeitschrift, siehe Blast (Zeitschrift) einen Actionfilm, siehe Blast – Dem Terror entkommt niemand BLAST steht für: Basic Local Alignment …   Deutsch Wikipedia

  • Blast (BD) — Blast Série Auteur Manu Larcenet Scénario Manu Larcenet Dessin Manu Larcenet Couleurs Manu Larcenet Genre(s) Roman graphique …   Wikipédia en Français


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»