Википедия

Консервативные мотивы

Моти́в в молекулярной биологии это группа относительно коротких последовательностей нуклеотидов или аминокислот, обладающих достаточным сходством вследствие выполнения ими одной биологической функции, например, связывания одного транскрипционного фактора, и, как следствие, слабо меняющияся в процессе эволюции . Таким образом, под мотивом подразумевают не конкретную последовательность, а каким-либо образом описанный спектр последовательностей, каждая из которых способна выполнять определённую биологическую функцию данного мотива.

Мотивы встречаются в живых организмах повсеместно и выполняют множество жизненно важных функций, таких как регуляция транскрипции и трансляции (в случае нуклеотидных мотивов), посттрансляционная модификация и клеточная локализация белков, и частично обуславливают их функциональные свойства (лейциновая молния). Они широко используются в биоинформатике для предсказания функций генов и белков, построения карт регуляции, важны для многих задач генной инженерии и молекулярной биологии в целом.

В связи с практической важностью мотивов, разработаны как биоинформатические методы их поиска (MEME, Gibbs Sampler), так и методы поиска мотивов in vivo (ChIP-seq, ChIP-exo). Последние довольно часто дают приблизительные координаты мотивов и их результаты затем уточняются биоинформатическими методами.Для удобства хранения мотивов в базах данных используются их разные, отличающееся степенью детальности, представления, наиболее распространенными из которых являются консенсус и позиционная весовая матрица.

Следует отличать мотив от консервативных участков в близкородственных организмах, необладающих значимыми биологическими функциями, где мутационный процесс не успел ещё достаточно их изменить.

Мотивы в нуклеиновых кислотах

В случае с ДНК чаще всего мотивы представляют собой короткие последовательности, являющиеся сайтами связывания для белков, таких, как нуклеазы и транскрипционные факторы, или вовлечённые в важные регуляторные процессы уже на уровне РНК, такие как посадка рибосомы, процессинг мРНК и терминация транскрипции.

Краткая история изучения

Изучение мотивов в ДНК стало возможным благодаря появлению в 1973 году процедуры секвенирования ДНК (определения последовательности нуклеотидов фрагмента ДНК). Первыми были определены последовательности lac-оператора и лямбда-оператора. Однако до появления более производительных методов секвенирования, количество последовательностей мотивов оставалось достаточно малым. К концу 1970-х годов появилось множество примеров мутантных последовательностей (сайтов), связывающих транскрипционные факторы и последовательностей с изменённой специфичностью. С увеличением количества последовательностей, стали развиваться и методы теоретического предсказания мотивов. В 1982 году была впервые сконструирована позиционно-весовая матрица (ПВМ) мотива сайта инициации трансляции. С помощью построенной ПВМ были предсказаны другие сайты инициации трансляции. Этот подход оказался достаточно мощным и до сих пор в разных формах применяется для поиска известных мотивов в геномах, а конкретные методы различаются только видом весовой функции. Однако подход, основанный на построении ПВМ на базе уже имеющихся последовательностей, не позволял находить принципиально новые мотивы, что является более сложной задачей. Первый алгоритм, решавший эту задачу, был предложен Галласом с коллегами в 1985 году. Этот алгоритм был основан на поиске общих слов в наборе последовательностей и давал большой процент ложноотрицательных результатов, однако он стал основой для целого семейства алгоритмов. Позднее были разработаны более точные вероятностные методы: алгоритм MEME, основанный на процедуре максимизации ожидания и алгоритм , также основанный на процедуре максимизации ожидания. Оба метода оказались очень чувствительными и используются в настоящее время для предсказания мотивов в наборах последовательностей.

После разработки мощных средств для предсказания мотивов связывания транскрипционных факторов и установления соответствия между достаточным количеством транскрипционных факторов и мотивов, стало возможным предсказывать функции оперона, лежащего поблизости от мотива по специфичности транскрипционного фактора, с ним связывающегося и наоборот, предсказывать транскрипционный фактор по генам в опероне, лежащем рядом с определённым мотивом.

Сайты связывания

Регуляция транскрипции

Характерными примерами регуляции транскрипции, осуществляемой с помощью белка, распознающего специальный мотив, являются:

  1. Сайт пуринового репрессора PurR у Escherichia coli. PurR связывается с последовательностью в 16 нуклеотидов, которая расположена перед и регулирует транскрипцию генов, ответственных за синтез пуриновых и пиримидиновых нуклеотидов. Интересно, что у бактерии Bacillus subtilis, эволюционно далёкой от кишечной палочки, также есть пуриновый репрессор, не гомологичный PurR;
  2. Сайт лактозного оперона Lac. Лактозный оперон контролируется репрессором LacI, который, связывая ДНК, препятствует транскрипции генов, ответственных за катаболизм лактозы.
Регуляция трансляции

Одними из наиболее известных примеров регуляции трансляции при помощи мотив-распознающих регуляторов являются:

  1. Сайт посадки рибосомы прокариот — последовательность Шайн — Дальгарно, здесь связывание происходит с рибопротеином;
  2. Сайт посадки рибосомы эукариот — последовательность Козак, связывание происходит с эукариотическим фактором инициации трансляции eIF1;
  3. IRE — регуляторные элементы, располагающиеся на 5’UTR и/или 3’UTR мРНК ферментов (к примеру, ферритина), регулирующие содержание железа в клетке. С этими мотивами связываются белки IRP1 (цитозольная форма аконитазы) и IRP2 (каталитически неактивный гомолог аконитазы), регулируя самим фактом своего связывания с мРНК скорость её деградации или скорость трансляции, происходящей с неё.
Сила мотива

Сила взаимодействия белка или РНК с ДНК мотивом зависит в первую очередь от последовательности данного мотива. Различают «сильные» мотивы, дающие сильное взаимодействие с белком или РНК и «слабые» мотивы, с которыми взаимодействие слабее. Практически всегда удаётся получить так называемую «консенсусную последовательность» («консенсус»), то есть такую последовательность, в каждой позиции которой стоит буква, наиболее часто встречающаяся в соответствующей позиции в последовательностях мотивов из разных организмов. Консенсусная последовательность принимается за самую сильную, каковой она почти всегда и является. Более слабые мотивы получаются из неё с помощью небольшого (чаще всего 1—3) числа замен.

Эволюция силы мотива

В процессе эволюции сила мотивов регулируется с помощью естественного отбора, причём мотив может становиться как сильнее, так и слабее. Характерным примером такой подстройки силы мотива может служить изменчивость последовательности Шайна — Дальгарно (ШД). Есть тесная корреляция между необходимым организму количеством транслируемого белка и силой ШД перед ним.

В случае с ШД, хотя сила связывания белка и напрямую коррелирует с силой связывания 16S-субъединицы рибосомы, в связи с особенностями инициации трансляции, консенсусная последовательность не обязательно будет гарантировать наиболее эффективную трансляцию (из-за затруднённого ухода рибосомы с сайта инициации). Поэтому последовательность Шайна — Дальгарно чаще всего содержит 4—5 нуклеотидов из консенсусной последовательности при длине последней примерно в 7 нуклеотидов.

РНК-переключатели

Не всегда наличие мотива, явно выполняющего биологически значимую роль, влечёт за собой наличие белка-регулятора. Регуляция также может осуществляться за счёт связывания РНК с каким-либо низкомолекулярным веществом. На этом принципе построены  — структуры, образующиеся на РНК во время транскрипции, способные связывать малые молекулы. Связывание молекулы влияет на способность рибопереключателя останавливать транскрипцию или препятствовать трансляции. В этом случае важной оказывается не последовательность нуклеотидов как таковая, а наличие комплементарных нуклеотидов на нужных местах в последовательности.

Регуляция за счёт вторичной структуры

Регуляция трансляции также может осуществляться только за счёт образуемой нуклеиновой кислотой вторичной структуры.

  1. Ро-независимый терминатор транскрипции — шпилька, образующаяся на синтезируемой мРНК до начала трансляции, препятствующая дальнейшему синтезу мРНК (Терминатор (ДНК));
  2. IRES — сложная структура в мРНК вирусов эукариот, обеспечивающий внутреннюю инициацию трансляции.

Структура мотива

Зачастую, мотивы, связывающие транскрипционные факторы, имеют вид прямых повторов некоторой последовательности, обратных повторов или палиндромных последовательностей. Это можно объяснить работой транскрипционных факторов в виде димеров белков, в которых каждый из мономеров связывает одну и ту же последовательность. Встречаются также мотивы большей повторности. Такое строение мотивов обеспечивает большую резкость реакции на изменение внешних условий. К примеру, если связывание зависит от концентрации одного вещества в клетке, то получаем зависимость силы реакции клетки, описываемую уравнением Михаэлиса — Ментен. С увеличением числа связывающихся единиц белка (будем считать, что действие связывания белка с мотивом проявляется только в случае связывания со всеми повторами) зависимость всё больше становится похожей на сигмоиду, в пределе стремясь к функции Хевисайда, описывающей один из главных принципов реагирования живых систем на многие воздействия — закон «всё или ничего» (англ. all-or-nothing law), к примеру, формирования потенциала действия.

Мотивы в белках

Для белков следует различать

Мотивы в первичной структуре (последовательности белка)

Мотивы в первичной структуре похожи на мотивы в нуклеиновых кислотах. Характерными примерами таковых являются:

  1. сигнальные пептиды — короткие аминокислотные последовательности в составе белка длиной порядка 3—60 аминокислот, определяющие, в какой компартмент клетки будет отправлен после синтеза. Пример — сигнал ядерной локализации;
  2. сайты посттрансляционной модификации белков, представляющие собой консервативные пептиды порядка 5—12 аминокислот. Пример — сайты ацетилирования в белке

Структурные мотивы

В белках структурные мотивы описывают связи между элементами вторичной структуры. Такие мотивы часто имеют участки переменной длины, которые в некоторых случаях могут и вовсе отсутствовать.

  1. Лейциновая молния — характерен для димерных белков, связывающих ДНК. Лейциновая молния обеспечивает контакт двух мономеров белка за счёт гидрофобных взаимодействий. Для него характерно наличие в каждой седьмой позиции остатка лейцина.
  2. Цинковые пальцы — характерен для ДНК-связывающих факторов транскрипции;
  3. Спираль-поворот-спираль — ДНК-связывающий мотив, именно такой ДНК-связывающий фрагмент у Lac-репрессора.
  4. Гомеодомен — мотив, связывающий ДНК и РНК. У эукариот белки с гомеодоменами индуцируют дифференцировку клеток, запуская каскады генов, необходимых для образования тканей и органов. Похож на мотив «спираль-поворот-спираль», потому часто отдельно не выделяется.
  5. Укладка Россмана — мотив, связывающий нуклеотиды (к примеру — НАД). Встречается, в частности, в дегидрогеназах, в том числе в , участвующей в гликолизе.
  6. EF-рука — мотив, связывающий ионы Са2+, также подобен мотиву «спираль-поворот-спираль».
  7.  — три последовательных аминокислотных остатка формируют сайт связывания аниона.
  8.  — три последовательных аминокислотных остатка формируют сайт связывания катиона.
  9. Бета-шпилька — два β-тяжа, соединённых коротким разворотом цепи белка.

Кроме бета-шпильки выделяют и множество других мотивов, функция которых состоит в формировании структурного каркаса белка.

Близким к термину структурный мотив белка является  — характерное расположение элементов вторичной структуры. В силу своей схожести термины часто используются один вместо другого и грань между ними размыта.

Представление мотивов

Изначально имеется набор мотивов из разных последовательностей и ставится задача:

  • представить их компактно и наглядно;
  • уметь по представлению мотива осуществлять поиск его новых вхождений.

Существует несколько общепризнанных способов представления мотивов. Часть из них подходит как для белков, так и для нуклеотидов, другая часть — только для белков или нуклеотидов.

Консенсус

Строгий консенсус

Строгим консенсусом мотива назовем строчку, состоящую из самых представленных букв в множестве реализаций мотива. На практике, указывается не просто наиболее частая буква в данной позиции, но и, если максимальная частота встречаемости какой-либо буквы в данной позиции меньше заданного порога, то на этом месте в консенсусе ставится x (любая буква алфавита). По такому консенсусу мы почти наверняка находим последовательности, реально являющиеся мотивами, но упускаем большое число мотивов, отличающихся от консенсуса на несколько замен. Ниже приведён пример строгого консенсуса для участка мотива пяти взятых из UniProt белков с мотивом лейциновой молнии (порог был взят равным 80 %):

Номер позиции
UniProt ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
O35048 L S P C G L R L I G A H P I L
Q6XXX9 L G Q D I C D L F I A L D V L
Q9N298 L G Q V T C D L F I A L D V L
Q61247 L S P L S V A L A L S H L A L
B0BC06 L T I G Q Y S L Y A I D G T L
Консенсус L x x x x x x L x x x x x x L

Нестрогий консенсус

Нестрогим консенсусом назовем последовательность списков букв, наиболее представленных на соответствующем месте. Описываются все или наиболее часто встречающиеся буквы в данной позиции (обычно устанавливается минимальный порог частоты). Фактически, мотив описывается при помощи регулярного выражения. В качестве обозначений используют:

  • Алфавит — совокупность отдельных символов, обозначающих определённую аминокислоту/нуклеотид или набор аминокислот/нуклеотидов;
  • ABC — строка из символов алфавита, обозначающая последовательность символов, следующих друг за другом;
  • [ABC] — любая строка символов, взятых из алфавита в квадратных скобках соответствует любому из соответствующих символов; например [ABC] соответствует или A или B или C;
  • {ABC..DE} — любая строка символов, взятых из алфавита, соответствует любой аминокислоте, кроме тех, что находятся в фигурных скобках; например {ABC} соответствует любой аминокислоте, кроме A, B и C;
  • x в нижнем регистре — любой символ алфавита.

В случае с таким представлением приходится балансировать между чувствительностью консенсуса (количеством реальных мотивов, которые им получится отыскать) и специфичностью (способностью метода отбраковывать мусорные последовательности). Ниже приведен пример нестрого консенсуса для тех же пяти последовательностей белков, что и для строго консенсуса (порог был взят равным 20 %). Видим, что в позиции 10 мотив не совсем объективен — лейцин (L) и изолейцин (I) — очень близкие по свойствам аминокислоты, и логично было бы их обе занести в консенсус.

Номер позиции
UniProt ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
O35048 L S P C G L R L I G A H P I L
Q6XXX9 L G Q D I C D L F I A L D V L
Q9N298 L G Q V T C D L F I A L D V L
Q61247 L S P L S V A L A L S H L A L
B0BC06 L T I G Q Y S L Y A I D G T L
Консенсус L [SG] [PQ] x x C D L F I A [LH] D V L

Prosite-консенсус (для белков)

PROSITE использует ИЮПАК для обозначения однобуквенных кодов аминокислот, за исключением символа конкатенации «-», используемого между элементами паттерна. При использовании PROSITE добавляется несколько символов, облегчающих представление белкового мотива:

  • '<' — шаблон ограничивается N-концом последовательности;
  • '>' — шаблон ограничивается C-концом последовательности;

Если e — шаблон элемента, и m и n два десятичных целых числа и m <= n, то:

  • e(m) эквивалентно повторению e ровно m раз;
  • e(m,n) эквивалентно повторению e ровно k раз для любого целого k удовлетворяющего условию: m <= k <= n;

Пример: мотив домена с сигнатурой C2H2-type цинкового пальца выглядит следующим образом: C-x(2,4)-C-x(3)-[LIVMFYWC]-x(8)-H-x(3,5)-H

Позиционная весовая матрица

Позиционной весовой матрицей называется такая матрица, столбцы которой соответствуют позиции в последовательности, а строчки соответствуют буквам в алфавите. Значениями этой матрицы являются частоты (или монотонные функции от частот) встречаемости данной буквы в данной позиции на последовательности. При этом обычно, чтобы исключить нулевые частоты к числу встреч каждой буквы позиции добавляют некоторое число, исходя из априорного распределения букв в подобных последовательностях (к примеру, вводят поправку Лапласа). Данный подход, как и предыдущие, неявно предполагает, что позиции в мотиве независимы, чего на самом деле не наблюдается даже для нуклеотидных последовательностей.

Пусть у нас есть 7 последовательностей ДНК, представляющих собой мотив:

Номер позиции
Номер

последовательности

1 2 3 4 5 6 7 8
1 A T C C A G C T
2 G G G C A A C T
3 A T G G A T C T
4 A A G C A A C C
5 T T G G A A C T
6 A T G C C A T T
7 A T G G C A C T

Позиционная матрица для них будет иметь следующий вид (+1 — учёт правила Лапласа):

Номер позиции
Нуклеотид 1 2 3 4 5 6 7 8
A 5 + 1 1 + 1 0 + 1 0 + 1 5 + 1 5 + 1 0 + 1 0 + 1
C 1 + 1 0 + 1 1 + 1 4 + 1 2 + 1 0 + 1 6 + 1 1 + 1
G 0 + 1 1 + 1 6 + 1 3 + 1 0 + 1 1 + 1 0 + 1 0 + 1
T 1 + 1 5 + 1 0 + 1 0 + 1 0 + 1 1 + 1 1 + 1 6 + 1

Частоты можно пронормировать на общее число последовательность, тем самым получив оценку вероятности встречи данного нуклеотида в данной последовательности (собственно, обычно в таком представлении и хранится PWM):

Номер позиции
Нуклеотид 1 2 3 4 5 6 7 8
A 0,55 0,18 0,09 0,09 0,55 0,55 0,09 0,09
C 0,18 0,09 0,18 0,45 0,27 0,09 0,64 0,18
G 0,09 0,18 0,64 0,36 0,09 0,18 0,09 0,09
T 0,18 0,55 0,09 0,09 0,09 0,18 0,18 0,64

HMM (скрытые марковские модели)

image
Скрытая марковская модель нулевого порядка для приведённых выше последовательностей одного мотива. Каждое состояние соответствует одной из позиций, вероятность перехода из одного состояния в другое равна 1. Эмиссионные вероятности для нуклеотидов изображены на состояниях

Для большей точности можно учитывать зависимость соседних позиций в мотиве с помощью скрытых марковских моделей первого и более высоких порядков. Этот подход сопряжён с некоторыми трудностями, так как для его применения необходимо наличие достаточно представительной выборки вариантов мотивов. В случае предыдущего примера имеем:

  • Для марковской модели порядка 0 (вероятность появления нуклеотида в данной позиции от других позиций не зависит — другой способ трактовки PWM);
image
Скрытая марковская модель первого порядка для приведённых выше последовательностей одного мотива. Каждое состояние соответствует нуклеотиду в одной из позиций, вероятность перехода из одного состояния во другое равна вероятности появления после нуклеотида, соответствующего этому состоянию, нуклеотида, соответствующего другому
  • Для марковской модели порядка 1 (вероятность появления нуклеотида в данной позиции зависит только от нуклеотида в предыдущей последовательности. Число параметров модели сильно возросло). При расчёте вероятностей перехода также использовалось правило Лапласа. Эмисионные вероятности для состояний равны 1 для нуклеотидов, которым они соответствуют, 0 — для остальных.

В случае мотивов, содержащих участки переменного размера и нуклеотидного состава, можно было бы вводить отдельно модель для этих участков, отдельно — для консервативных, а затем «склеивать» их в одну модель путём добавления промежуточных «молчащих» состояний и вероятностей перехода в них и из них.

СКС (стохастическая контекстно-свободная грамматика)

В случае мотивов, формирующих вторичные структуры (РНК-переключатели) в РНК, в элементах вторичной структуры важно учитывать возможность спаривания нуклеотидов. С этой задачей справляются СКС. Однако обучение СКС требует ещё большего размера выборки, чем HMM, и сопряжено с рядом трудностей.

Представление для больших базах данных

В тех случаях, когда важна скорость поиска и допустим пропуск некоторых вхождений нашего мотива, исследователи прибегают к различным уловкам, позволяющим с приемлемой точностью зашифровать пространственную структур биополимера (РНК или белка) путём расширения алфавита.

Представление мотивов в белках с помощью кодирования пространственной структуры белка

Оперон Escherichia coli репрессор лактозы LacI (PDB 1lcc chain A) и ген активатор катаболизма (PDB 3gap chain A) оба имеют мотив спираль-поворот-спираль, но их аминокислотные последовательности не очень схожи. Группой исследователей был разработан код, который они назвали «трёхмерный код цепи», представляющий структуру белка в виде строки из писем. Эта схема кодирования, по мнению авторов, показывает сходство между белками гораздо более отчётливо, чем аминокислотные последовательности:

Пример: сравнение двух упомянутых выше белков при помощи этой схемы кодирования:

PDB ID 3D-code Amino acid sequence
1lccA TWWWWWWWKCLKWWWWWWG LYDVAEYAGVSYQTVSRVV
3gapA KWWWWWWGKCFKWWWWWWW RQEIGQIVGCSRETVGRIL
Сравнение Видно явное сходство между белками По аминокислотной последовательности белки сильно отличаются

где W соответствует α-спирали, и E и D соответствует β-нити.

Представление мотивов в РНК с помощью вторичной структуры (foldedBlast)

В данной работе с целью применения алгоритма поиска, схожего с BLAST, нуклеотидный алфавит (ATGC, так как поиск осуществлялся в геноме) был расширен за счёт комбинирования нуклеотидов и трех символов, характеризующих их предположительное направление спаривания:

  • ( — нуклеотид спарен с нуклеотидом справа;
  • ) — нуклеотид спарен с нуклеотидом слева;
  • . — нуклеотид не спарен.

Таким образом получалось 12 букв нового алфавита (4 нуклеотида * 3 «направления»), при правильном использовании позволяющий осуществлять BLAST-подобный поиск, названный авторами foldedBlast.

Логотип последовательностей

image
Мотив сайта связывания пуринового репрессора PurR из Escherichia coli. Получен с помощью пакета R seqLogo

Для визуального представления мотивов часто используют логотип последовательностей — графического представления консервативности каждой позиции в мотиве. При этом данную визуализацию можно успешно применять как и в случае представления мотива в виде консенсуса или позиционной весовой матрицы, так и для представления HMM модели последовательности, как это сделано в базе белковых семейств Pfam.

Кроме того, если использовать, к примеру, яркость каждой нуклеотида в мотиве как индикатор того, насколько часто ему соответствует в этом же мотиве комплементарный нуклеотид, то можно частично представлять и информацию о вторичной структуре мотива. Так сделано, например, в биоинформатическом веб-сервисе RegPredict.

Поиск сайтов связывания транскрипционных факторов in silico

В случае поиска в нуклеотидных последовательностях мотивов, отвечающих за связывание регуляторных белков пользуются соображением, что они [мотивы] меняются сравнительно медленно, а значит, если взять организмы, достаточно далёкие друг от друга, чтобы в высоковариабельных позициях их последовательностей успели накопиться мутации, а сайты измениться сильно ещё не успели, то можно пользоваться правилом «что консервативно — то важно». После получения последовательностей, в которых предполагается наличия специфичного мотива, в основном используют два подхода к поиску последовательности мотива — филогенетический футпринтинг и сведение задачи к задаче поиска вставленного мотива.

Филогенетический футпринтинг

Филогенетический футпринтинг — полуавтоматический метод. Последовательности обрабатываются программой множественного выравнивания, и в получившемся выравнивании исследователем ищутся паттерны, которые можно считать мотивами. Одним из наиболее успешных примеров применения данного подхода можно считать расшифровку способа кодирования нерибосомных пептидов нерибосомными пептид-синтетазами (NRPS). Данный метод не позволяет полностью автоматизировать процесс поиска мотивов, но при этом и не имеет столь сильных ограничений, как следующие.

Задача поиска вставленного мотива

В случае с мотивами без (почти без) разрывов и без (почти без) участков переменной длины возможно свести задачу поиска мотива к задаче поиска вставленного мотива (англ. Planted motif search).

Формулировка задачи следующая: «На вход предоставлены n строк s1, s2, …, sn длины m, каждая составленная из символов алфавита A, и два числа — l и d. Найдите все строки x длины l такие, что любая из предоставленных строки содержит хотя бы одну подпоследовательность, находящуюся от x на расстоянии Хэмминга не больше d».

Так как в общем случае неизвестно, все ли полученные нами последовательности имеют искомый мотив, а также неизвестна его точная длина, то обычно задачу решают эвристическими методами — максимизируя вероятность найденного мотива при данных последовательностях. На этом принципе построены программы MEME и GibbsSampler.

Если задать минимальный порог на число последовательностей, в которых должен содержаться мотив, и как-либо ограничить его длину, то можно использовать и точные способы решения данной задачи, к примеру — алгоритм RISOTTO. Некоторые из них позволяют снимать часть ограничений на искомый мотив — в RISOTTO искомый мотив может иметь разрывы, состоять из нескольких частей.

Однако эти методы редко дают результаты лучше, чем MEME и GibbsSamler, а работают они значительно дольше.

Поиск сайтов связывания in vitro

ChIP-seq

Метод анализа ДНК-белковых взаимодействий, комбинирующий идеи иммунопреципитации хроматина (ChIP) и высокоэффективном секвенировании ДНК (белок пришивается к ДНК, затем кусочки ДНК, пришившиеся к белку отправляются на секвенирование). В ходе работы метода получаются участки длиной около 150 нуклеотидов, которые затем можно анализировать in silico на наличие мотива.

ChIP-on-chip

Как и в случае использования метода ChIP-seq проводится иммунопреципитации хроматина (ChIP), затем сшивка с белком обращается и полученная ДНК гибридизуется с ДНК-микрочипом. Метод ChIP-on-chip дешевле, чем ChIP-seq, однако сильно уступает последнему в точности.

ChIP-exo

Также метод, основанный на иммунопреципитации хроматина (ChIP). Использование экзонуклеазы фага λ, деградирующей ДНК только с 5'-конца и только в случае отсутствия контакта с белком, позволяет добиваться точности порядка нескольких нуклеотидов в определении положения сайта связывания белка.

SELEX

Итеративный метод поиска нуклеотидных последовательностей, хорошо связывающихся с данным белком. Процедура в общем случае выглядит так:

  1. Интересующий нас белок пришивается к колонке, через которую далее пропускается раствор с набором последовательностей, состоящих из рандомизированного участка и адаптера;
  2. Последовательности, задержавшиеся на колонке клонируют процедуре ПЦР, причем состав реакционной смеси подобран таким образом, чтобы вносить дополнительные ошибки при копировании. Полученные клоны отправляются на новый раунд SELEX;
  3. Через каждые несколько участков условия (pH раствора, его ионная сила) ужесточаются, чтобы на колонке оставались все более и более специфичные к белку последовательности;
  4. Получающиеся на выходе последовательности часто похожи на реальные мотивы связывания белка в живых организмах.

DamID

Делается гибридный белок из изучаемого белка и адениновой ДНК-метилтрансферазы Dam. В естественных условиях аденин в большинстве эукариот не метилируется. Когда же гибридный белок связывается с каким-либо сайтом в ДНК организма, метилтрансферазная часть модифицирует аденины в районе этого сайта, что позволяет затем с помощью эндонуклеаз рестрикции выделить участок, на котором с большой долей вероятности находится искомый мотив.

Примечания

  1. D'haeseleer Patrik. What are DNA sequence motifs? (англ.) // Nature Biotechnology. — 2006. — 1 April (vol. 24, iss. 4). — P. 423–425. — ISSN 1087-0156. — doi:10.1038/nbt0406-423. Архивировано 12 апреля 2017 года.
  2. Compeau Phillip, Pevzner Pavel. Bioinformatics Algorithms: An Active Learning Approach, 2nd Ed. Vol. 1 by Phillip Compeau (англ.). — 2nd edition. — Active Learning Publishers, 2015. — 384 p. — ISBN 9780990374619.
  3. Koonin Eugene V. The Logic of Chance: The Nature and Origin of Biological Evolution. — 1 edition. — FT Press, 2011-06-23. — 529 с. — ISBN 978-0132542494.
  4. Durbin Richard, Eddy Sean R., Krogh Anders, Mitchison Graeme. Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. — Cambridge University Press, 1998. — 372 с. — ISBN 978-0521620413.
  5. Purine repressor - Proteopedia, life in 3D (англ.). proteopedia.org. Дата обращения: 11 апреля 2017. Архивировано 12 апреля 2017 года.
  6. Alberts Bruce, Johnson Alexander, Lewis Julian, Raff Martin, Roberts Keith. Molecular Biology of the Cell. — 4th. — Garland Science, 2002-01-01. — ISBN 0815332181. — ISBN 0815340729. Архивировано 27 сентября 2017 года.
  7. Pestova T. V., Kolupaeva V. G., Lomakin I. B., Pilipenko E. V., Shatsky I. N. Molecular mechanisms of translation initiation in eukaryotes (англ.) // Proceedings of the National Academy of Sciences of the United States of America. — 2001. — 19 June (vol. 98, iss. 13). — P. 7029–7036. — ISSN 0027-8424. — doi:10.1073/pnas.111145798. Архивировано 23 апреля 2017 года.
  8. Evfratov Sergey A., Osterman Ilya A., Komarova Ekaterina S., Pogorelskaya Alexandra M., Rubtsova Maria P. Application of sorting and next generation sequencing to study 5΄-UTR influence on translation efficiency in Escherichia coli (англ.) // Nucleic Acids Research. — 2017. — 7 April (vol. 45, iss. 6). — P. 3487–3502. — ISSN 0305-1048. — doi:10.1093/nar/gkw1141. Архивировано 12 апреля 2017 года.
  9. Jones Neil C., Pevzner Pavel A. An Introduction to Bioinformatics Algorithms. — 1 edition. — The MIT Press, 2004. — 435 с. — ISBN 9780262101066.
  10. Gilbert W, Maxam A. The nucleotide sequence of the lac operator (англ.) // Proceedings of the National Academy of Sciences. — 1973. — December (vol. 70, iss. 12). — P. 3581—3584. — PMID 4587255. Архивировано 24 апреля 2017 года.
  11. Maniatis T, Ptashne M, Backman K, Kield D, Flashman S, Jeffrey A, Maurer R. Recognition sequences of repressor and polymerase in the operators of bacteriophage lambda (англ.) // Cell. — 1975. — June (vol. 5, iss. 2). — P. 109—113. — PMID 1095210. Архивировано 24 апреля 2017 года.
  12. Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors (англ.) // Proceedings of the National Academy of Sciences. — 1977. — December (vol. 74, iss. 12). — P. 5463—5467. Архивировано 2 апреля 2017 года.
  13. Stormo GD. DNA binding sites: representation and discovery. (англ.) // Bioinformatics. — 2000. — January (vol. 16, iss. 1). — P. 16—23. Архивировано 19 апреля 2017 года.
  14. Stormo GD, Schneider TD, Gold LM. Characterization of translational initiation sites in E. coli (англ.) // Nucleic Acids Research. — 1982. — 11 May (vol. 10, iss. 9). — P. 2971—2996. Архивировано 24 апреля 2017 года.
  15. Galas DJ, Eggert M, Waterman MS. Rigorous pattern-recognition methods for DNA sequences. Analysis of promoter sequences from Escherichia coli. (англ.) // Journal of Molecular Biology. — 1985. — 5 November (vol. 186, no. 1). — P. 117–128. Архивировано 24 апреля 2017 года.
  16. Stormo GD. DNA binding sites: representation and discovery. (англ.) // Bioinformatics. — 2000. — January (vol. 16, no. 1). — P. 16–23. Архивировано 19 апреля 2017 года.
  17. T. L. Bailey, C. Elkan. The value of prior knowledge in discovering motifs with MEME (англ.) // Proceedings. International Conference on Intelligent Systems for Molecular Biology. — 1995. — 1 January (vol. 3). — P. 21–29. — ISSN 1553-0833. Архивировано 24 апреля 2017 года.
  18. Lawrence CE1, Altschul SF, Boguski MS, Liu JS, Neuwald AF, Wootton JC. Detecting subtle sequence signals: a Gibbs sampling strategy for multiple alignment. (англ.) // Science. — 1993. — 8 October (vol. 262, no. 5131). — P. 208–214. Архивировано 24 апреля 2017 года.
  19. Jendresen Christian Bille, Martinussen Jan, Kilstrup Mogens. The PurR regulon in Lactococcus lactis - transcriptional regulation of the purine nucleotide metabolism and translational machinery (англ.) // Microbiology (Reading, England). — 2012. — 1 August (vol. 158, iss. 8). — P. 2026–2038. — ISSN 1465-2080. — doi:10.1099/mic.0.059576-0. Архивировано 19 апреля 2017 года.
  20. Sinha Sangita C., Krahn Joseph, Shin Byung Sik, Tomchick Diana R., Zalkin Howard. The purine repressor of Bacillus subtilis: a novel combination of domains adapted for transcription regulation (англ.) // Journal of Bacteriology. — 2003. — 1 July (vol. 185, iss. 14). — P. 4087–4098. — ISSN 0021-9193. — doi:10.1128/JB.185.14.4087-4098.2003. Архивировано 19 апреля 2017 года.
  21. Shine J., Dalgarno L. Terminal-sequence analysis of bacterial ribosomal RNA. Correlation between the 3'-terminal-polypyrimidine sequence of 16-S RNA and translational specificity of the ribosome (англ.) // European Journal of Biochemistry. — 1975. — 1 September (vol. 57, iss. 1). — P. 221–230. — ISSN 0014-2956. Архивировано 19 апреля 2017 года.
  22. Nelson David L., Cox Michael M. Lehninger Principles of Biochemistry. — 7 edition. — W. H. Freeman, 2017-01-01. — 1328 с. — ISBN 9781464126116.
  23. Stormo G. D., Schneider T. D., Gold L. Quantitative analysis of the relationship between nucleotide sequence and functional activity (англ.) // Nucleic Acids Research. — 1986. — 26 August (vol. 14, iss. 16). — P. 6661–6679. — ISSN 0305-1048. Архивировано 19 апреля 2017 года.
  24. Stormo G. D. DNA binding sites: representation and discovery (англ.) // Bioinformatics (Oxford, England). — 2000. — 1 January (vol. 16, iss. 1). — P. 16–23. — ISSN 1367-4803. Архивировано 19 апреля 2017 года.
  25. Shultzaberger Ryan K., Zehua Chen, Lewis Karen A., Schneider Thomas D. Anatomy of Escherichia coli σ 70 promoters (англ.) // Nucleic Acids Research. — 2007. — 1 February (vol. 35, iss. 3). — P. 771–788. — ISSN 1362-4962. — doi:10.1093/nar/gkl956. Архивировано 19 апреля 2017 года.
  26. J. Shine, L. Dalgarno. Terminal-sequence analysis of bacterial ribosomal RNA. Correlation between the 3'-terminal-polypyrimidine sequence of 16-S RNA and translational specificity of the ribosome (англ.) // European Journal of Biochemistry. — 1975. — 1 September (vol. 57, iss. 1). — P. 221—230. — ISSN 0014-2956. Архивировано 19 апреля 2017 года.
  27. Рибопереключатель, РНК-переключатель (riboswitch). humbio.ru. Дата обращения: 11 апреля 2017. Архивировано 12 апреля 2017 года.
  28. Samuel E. Bocobza, Asaph Aharoni. Small molecules that interact with RNA: riboswitch-based gene control and its involvement in metabolic regulation in plants and algae (англ.) // The Plant Journal: For Cell and Molecular Biology. — 2014. — 1 August (vol. 79, iss. 4). — P. 693–703. — ISSN 1365-313X. — doi:10.1111/tpj.12540. Архивировано 19 апреля 2017 года.
  29. Hironori Otaka, Hirokazu Ishikawa, Teppei Morita, Hiroji Aiba. PolyU tail of rho-independent terminator of bacterial small RNAs is essential for Hfq action (англ.) // Proceedings of the National Academy of Sciences of the United States of America. — 2011. — 9 August (vol. 108, iss. 32). — P. 13059–13064. — ISSN 0027-8424. — doi:10.1073/pnas.1107050108. Архивировано 3 июля 2022 года.
  30. Hiroshi Yamamoto, Marianne Collier, Justus Loerke, Jochen Ismer, Andrea Schmidt. Molecular architecture of the ribosome‐bound Hepatitis C Virus internal ribosomal entry site RNA (англ.) // The EMBO Journal. — 2015. — 14 December (vol. 34, iss. 24). — P. 3042–3058. — ISSN 0261-4189. — doi:10.15252/embj.201592469.
  31. Камкин Андрей, Каменский Андрей Александрович. Фундаментальная и клиническая физиология. — Academia, 2004-01-01. — 1072 с. — ISBN 5769516755.
  32. Structural Motifs. EMBL-EBI Train online (англ.). 25 ноября 2011. Архивировано 12 апреля 2017. Дата обращения: 12 апреля 2017.
  33. Gonter Blobel, Bernhand Dobberstein. Transfer of proteins across membranes. I. Presence of proteolytically processed and unprocessed nascent immunoglobulin light chains on membrane-bound ribosomes of murine myeloma (англ.) // The Journal of Cell Biology. — 1975. — 1 December (vol. 67, iss. 3). — P. 835–851. — ISSN 0021-9525. Архивировано 2 апреля 2022 года.
  34. Qiu Wang-Ren, Sun Bi-Qian, Xiao Xuan, Xu Zhao-Chun, Chou Kuo-Chen. iPTM-mLys: identifying multiple lysine PTM sites and their different types (англ.) // Bioinformatics (Oxford, England). — 2016. — 15 October (vol. 32, iss. 20). — P. 3116–3123. — ISSN 1367-4811. — doi:10.1093/bioinformatics/btw380. Архивировано 19 апреля 2017 года.
  35. Landschulz W. H., Johnson P. F., McKnight S. L. The leucine zipper: a hypothetical structure common to a new class of DNA binding proteins (англ.) // Science (New York, N.Y.). — 1988. — 24 June (vol. 240, iss. 4860). — P. 1759–1764. — ISSN 0036-8075. Архивировано 19 апреля 2017 года.
  36. Klug A., Rhodes D. Zinc fingers: a novel protein fold for nucleic acid recognition (англ.) // Cold Spring Harbor Symposia on Quantitative Biology. — 1987. — 1 January (vol. 52). — P. 473–482. — ISSN 0091-7451. Архивировано 19 апреля 2017 года.
  37. Bürglin Thomas R., Affolter Markus. Homeodomain proteins: an update (англ.) // Chromosoma. — 2016. — 1 January (vol. 125). — P. 497–521. — ISSN 0009-5915. — doi:10.1007/s00412-015-0543-8. Архивировано 8 марта 2021 года.
  38. Rao S. T., Rossmann M. G. Comparison of super-secondary structures in proteins (англ.) // Journal of Molecular Biology. — 1973. — 15 May (vol. 76, iss. 2). — P. 241–256. — ISSN 0022-2836. Архивировано 23 апреля 2017 года.
  39. Nelson Melanie R., Thulin Eva, Fagan Patricia A., Forsén Sture, Chazin Walter J. The EF-hand domain: A globally cooperative structural unit (англ.) // Protein Science : A Publication of the Protein Society. — 2017. — 14 April (vol. 11, iss. 2). — P. 198–205. — ISSN 0961-8368. — doi:10.1110/ps.33302.
  40. Watson James D., Milner-White E. James. A novel main-chain anion-binding site in proteins: the nest. A particular combination of φ,ψ values in successive residues gives rise to anion-binding sites that occur commonly and are found often at functionally important regions1 (англ.) // Journal of Molecular Biology. — 2002. — 11 January (vol. 315, iss. 2). — P. 171–182. — doi:10.1006/jmbi.2001.5227.
  41. Torrance Gilleain M., David P. Leader, Gilbert David R., Milner-White E. James. A novel main chain motif in proteins bridged by cationic groups: the niche (англ.) // Journal of Molecular Biology. — 2009. — 30 January (vol. 385, iss. 4). — P. 1076–1086. — ISSN 1089-8638. — doi:10.1016/j.jmb.2008.11.007. Архивировано 23 апреля 2017 года.
  42. Milner-White E. J., Poet R. Four classes of beta-hairpins in proteins. (англ.) // Biochemical Journal. — 1986. — 15 November (vol. 240, iss. 1). — P. 289–292. — ISSN 0264-6021.
  43. Efimov Alexander V. Favoured structural motifs in globular proteins (англ.) // Structure. — 1994. — 1 November (vol. 2, iss. 11). — P. 999–1002. — doi:10.1016/S0969-2126(94)00102-2.
  44. Holm L., Sander C. Dictionary of recurrent domains in protein structures (англ.) // Proteins. — 1998. — 1 October (vol. 33, iss. 1). — P. 88–96. — ISSN 0887-3585. Архивировано 23 апреля 2017 года.
  45. Schneider T. D., Stephens R. M. Sequence logos: a new way to display consensus sequences (англ.) // Nucleic Acids Research. — 1990. — 25 October (vol. 18, iss. 20). — P. 6097–6100. — ISSN 0305-1048. Архивировано 20 апреля 2017 года.
  46. de Castro Edouard, Sigrist Christian J. A., Gattiker Alexandre, Bulliard Virgini, Langendijk-Genevaux Petra S. ScanProsite: detection of PROSITE signature matches and ProRule-associated functional and structural residues in proteins (англ.) // Nucleic Acids Research. — 2006. — 1 July (vol. 34, iss. Web Server issue). — P. W362–365. — ISSN 1362-4962. — doi:10.1093/nar/gkl124. Архивировано 6 октября 2016 года.
  47. InterPro EMBL-EBI. Zinc finger C2H2-type (IPR013087) < InterPro < EMBL-EBI (англ.). www.ebi.ac.uk. Дата обращения: 15 апреля 2017. Архивировано 15 апреля 2017 года.
  48. Флах Петер. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. Учебник. — ДМК Пресс, 2015-01-01. — 400 с. — ISBN 9785970602737, 9781107096394.
  49. Matsuda H., Taniguchi F., Hashimoto A. An approach to detection of protein structural motifs using an encoding scheme of backbone conformations (англ.) // Pacific Symposium on Biocomputing. Pacific Symposium on Biocomputing. — 1997. — 1 January. — P. 280–291. — ISSN 2335-6936. Архивировано 23 апреля 2017 года.
  50. Tseng Huei-Hun, Weinberg Zasha, Gore Jeremy, Breaker Ronald r., Ruzzo Walter l. Finding non-coding rnas through genome-scale clustering (англ.) // Journal of bioinformatics and computational biology. — 2017. — 12 April (vol. 7, iss. 2). — P. 373–388. — ISSN 0219-7200.
  51. Schuster-Böckler Benjamin, Jörg Schultz, Rahmann Sven. HMM Logos for visualization of protein families (англ.) // BMC Bioinformatics. — 2004. — 1 January (vol. 5). — P. 7. — ISSN 1471-2105. — doi:10.1186/1471-2105-5-7.
  52. Novichkov Pavel S., Rodionov Dmitry A., Stavrovskaya Elena D., Novichkova Elena S., Kazakov Alexey E. RegPredict: an integrated system for regulon inference in prokaryotes by comparative genomics approach (англ.) // Nucleic Acids Research. — 2010. — 1 July (vol. 38, iss. Web Server issue). — P. W299–307. — ISSN 1362-4962. — doi:10.1093/nar/gkq531. Архивировано 24 апреля 2017 года.
  53. Marahiel Mohamed A. Multidomain enzymes involved in peptide synthesis (англ.) // FEBS Letters. — 1992. — 27 July (vol. 307, iss. 1). — P. 40–43. — ISSN 1873-3468. — doi:10.1016/0014-5793(92)80898-Q. Архивировано 12 апреля 2017 года.
  54. Stachelhaus T., Mootz H. D., Marahiel M. A. The specificity-conferring code of adenylation domains in nonribosomal peptide synthetases (англ.) // Chemistry & Biology. — 1999. — 1 August (vol. 6, iss. 8). — P. 493–505. — ISSN 1074-5521. — doi:10.1016/S1074-5521(99)80082-9. Архивировано 19 апреля 2017 года.
  55. Keich U., Pevzner P. A. Finding motifs in the twilight zone (англ.) // Bioinformatics (Oxford, England). — 2002. — 1 October (vol. 18, iss. 10). — P. 1374–1381. — ISSN 1367-4803. Архивировано 19 апреля 2017 года.
  56. Thompson William A., Newberg Lee A., Conlan Sean, McCue Lee Ann, Lawrence Charles E. The Gibbs Centroid Sampler (англ.) // Nucleic Acids Research. — 2007. — 1 July (vol. 35, iss. Web Server issue). — P. W232–237. — ISSN 1362-4962. — doi:10.1093/nar/gkm265.
  57. Carvalho A. M., Freitas A. T., Oliveira A. L., Sagot M. F. An efficient algorithm for the identification of structured motifs in DNA promoter sequences (англ.) // IEEE/ACM Transactions on Computational Biology and Bioinformatics. — 2006. — 1 April (vol. 3, iss. 2). — P. 126–140. — ISSN 1545-5963. — doi:10.1109/TCBB.2006.16. Архивировано 8 сентября 2017 года.
  58. Dinh Hieu, Rajasekaran Sanguthevar, Davila Jaime. qPMS7: A Fast Algorithm for Finding (ℓ, d)-Motifs in DNA and Protein Sequences (англ.) // PLOS ONE. — 2012. — 24 July (vol. 7, iss. 7). — ISSN 1932-6203. — doi:10.1371/journal.pone.0041425. Архивировано 15 июня 2022 года.
  59. Johnson David S., Mortazavi Ali, Myers Richard M., Wold Barbara. Genome-wide mapping of in vivo protein-DNA interactions (англ.) // Science (New York, N.Y.). — 2007. — 8 June (vol. 316, iss. 5830). — P. 1497–1502. — ISSN 1095-9203. — doi:10.1126/science.1141319. Архивировано 24 апреля 2017 года.
  60. Rhee Ho Sung, Pugh B. Franklin. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution (англ.) // Cell. — 2011. — 9 December (vol. 147, iss. 6). — P. 1408–1419. — ISSN 1097-4172. — doi:10.1016/j.cell.2011.11.013. Архивировано 24 апреля 2017 года.
  61. Tuerk C., Gold L. Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase (англ.) // Science (New York, N.Y.). — 1990. — 3 August (vol. 249, iss. 4968). — P. 505–510. — ISSN 0036-8075. Архивировано 24 апреля 2017 года.
  62. Greil Frauke, Moorman Celine, van Steensel Bas. DamID: mapping of in vivo protein-genome interactions using tethered DNA adenine methyltransferase (англ.) // Methods in Enzymology. — 2006. — 1 January (vol. 410). — P. 342–359. — ISSN 0076-6879. — doi:10.1016/S0076-6879(06)10016-6. Архивировано 24 апреля 2017 года.

Литература

  • Дурбин Р., Эдди Ш., Крог А., Митчисон Г. Анализ биологических последовательностей = Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. — Регулярная и хаотическая динамика, Институт компьютерных исследований, 2006. — С. 480. — ISBN 5939725597.
  • Jones Neil C., Pevzner Pavel A. An Introduction to Bioinformatics Algorithms (англ.). — The MIT Press, 2004. — ISBN 9780262101066.
  • Compeau Phillip, Pevzner Pavel. Bioinformatics Algorithms: An Active Learning Approach, 2nd Ed. Vol. 1 by Phillip Compeau (англ.). — Active Learning Publishers, 2015. — P. 384. — ISBN 9780990374619.
  • Durbin Richard, Eddy Sean R., Krogh Anders, Mitchison Graeme. Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids (англ.). — Cambridge University Press, 1998. — P. 372. — ISBN 978-0521620413.
  • Nelson David L., Cox Michael M. Lehninger Principles of Biochemistry (англ.). — W. H. Freeman, 2017. — P. 1328. — ISBN 9781464126116.

Ссылки

Видеокурсы по данной теме

  • Находим скрытые в ДНК сообщения — часть курса по биоинформатике от всемирно известного учёного П. А. Певзнера

Сервисы поиска мотивов

  • MEME Suite of motif-based sequence analysis tools — сервис для поиска мотивов в последовательностях одноимённым алгоритмом MEME
  • The Gibbs Motif Sampler — сервис для поиска мотивов в последовательностях алгоритмом Gibbs Sampler
  • RISOTTO motif discovery tool — главная страница программы для точного поиска мотивов RISOTTO
  • PMS — точный поиск мотивов при помощи алгоритмов семейства PMS
  • Bioprospector — поиск мотивов в последовательностях алгоритмом Gibbs Sampler
  • XXmotif — сервис для поиск мотивов в нуклеотидных последовательностях на основании прямой оптимизации статистической значимости PWM

Базы данных мотивов

  • PROSITE — база данных белковых семейств и доменов
  • TRANSFAC — коммерческая (ограниченный публичный доступ) база данных транскрипционных факторов
  • HOCOMOCO Архивная копия от 6 июня 2013 на Wayback Machine — коллекция траскрипционных факторов человека и мыши
  • Minimotif Miner — поиск коротких известных мотивов

Прочее

  • Wikiomic Sequence motifs page — статья о мотивах в последовательностях
  • Cis-analysis — список и короткие описания части программ поиска мотивов в последовательностях

Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Консервативные мотивы, Что такое Консервативные мотивы? Что означает Консервативные мотивы?

Moti v v molekulyarnoj biologii eto gruppa otnositelno korotkih posledovatelnostej nukleotidov ili aminokislot obladayushih dostatochnym shodstvom vsledstvie vypolneniya imi odnoj biologicheskoj funkcii naprimer svyazyvaniya odnogo transkripcionnogo faktora i kak sledstvie slabo menyayushiyasya v processe evolyucii Takim obrazom pod motivom podrazumevayut ne konkretnuyu posledovatelnost a kakim libo obrazom opisannyj spektr posledovatelnostej kazhdaya iz kotoryh sposobna vypolnyat opredelyonnuyu biologicheskuyu funkciyu dannogo motiva Motivy vstrechayutsya v zhivyh organizmah povsemestno i vypolnyayut mnozhestvo zhiznenno vazhnyh funkcij takih kak regulyaciya transkripcii i translyacii v sluchae nukleotidnyh motivov posttranslyacionnaya modifikaciya i kletochnaya lokalizaciya belkov i chastichno obuslavlivayut ih funkcionalnye svojstva lejcinovaya molniya Oni shiroko ispolzuyutsya v bioinformatike dlya predskazaniya funkcij genov i belkov postroeniya kart regulyacii vazhny dlya mnogih zadach gennoj inzhenerii i molekulyarnoj biologii v celom V svyazi s prakticheskoj vazhnostyu motivov razrabotany kak bioinformaticheskie metody ih poiska MEME Gibbs Sampler tak i metody poiska motivov in vivo ChIP seq ChIP exo Poslednie dovolno chasto dayut priblizitelnye koordinaty motivov i ih rezultaty zatem utochnyayutsya bioinformaticheskimi metodami Dlya udobstva hraneniya motivov v bazah dannyh ispolzuyutsya ih raznye otlichayusheesya stepenyu detalnosti predstavleniya naibolee rasprostranennymi iz kotoryh yavlyayutsya konsensus i pozicionnaya vesovaya matrica Sleduet otlichat motiv ot konservativnyh uchastkov v blizkorodstvennyh organizmah neobladayushih znachimymi biologicheskimi funkciyami gde mutacionnyj process ne uspel eshyo dostatochno ih izmenit Motivy v nukleinovyh kislotahV sluchae s DNK chashe vsego motivy predstavlyayut soboj korotkie posledovatelnosti yavlyayushiesya sajtami svyazyvaniya dlya belkov takih kak nukleazy i transkripcionnye faktory ili vovlechyonnye v vazhnye regulyatornye processy uzhe na urovne RNK takie kak posadka ribosomy processing mRNK i terminaciya transkripcii Kratkaya istoriya izucheniya Izuchenie motivov v DNK stalo vozmozhnym blagodarya poyavleniyu v 1973 godu procedury sekvenirovaniya DNK opredeleniya posledovatelnosti nukleotidov fragmenta DNK Pervymi byli opredeleny posledovatelnosti lac operatora i lyambda operatora Odnako do poyavleniya bolee proizvoditelnyh metodov sekvenirovaniya kolichestvo posledovatelnostej motivov ostavalos dostatochno malym K koncu 1970 h godov poyavilos mnozhestvo primerov mutantnyh posledovatelnostej sajtov svyazyvayushih transkripcionnye faktory i posledovatelnostej s izmenyonnoj specifichnostyu S uvelicheniem kolichestva posledovatelnostej stali razvivatsya i metody teoreticheskogo predskazaniya motivov V 1982 godu byla vpervye skonstruirovana pozicionno vesovaya matrica PVM motiva sajta iniciacii translyacii S pomoshyu postroennoj PVM byli predskazany drugie sajty iniciacii translyacii Etot podhod okazalsya dostatochno moshnym i do sih por v raznyh formah primenyaetsya dlya poiska izvestnyh motivov v genomah a konkretnye metody razlichayutsya tolko vidom vesovoj funkcii Odnako podhod osnovannyj na postroenii PVM na baze uzhe imeyushihsya posledovatelnostej ne pozvolyal nahodit principialno novye motivy chto yavlyaetsya bolee slozhnoj zadachej Pervyj algoritm reshavshij etu zadachu byl predlozhen Gallasom s kollegami v 1985 godu Etot algoritm byl osnovan na poiske obshih slov v nabore posledovatelnostej i daval bolshoj procent lozhnootricatelnyh rezultatov odnako on stal osnovoj dlya celogo semejstva algoritmov Pozdnee byli razrabotany bolee tochnye veroyatnostnye metody algoritm MEME osnovannyj na procedure maksimizacii ozhidaniya i algoritm takzhe osnovannyj na procedure maksimizacii ozhidaniya Oba metoda okazalis ochen chuvstvitelnymi i ispolzuyutsya v nastoyashee vremya dlya predskazaniya motivov v naborah posledovatelnostej Posle razrabotki moshnyh sredstv dlya predskazaniya motivov svyazyvaniya transkripcionnyh faktorov i ustanovleniya sootvetstviya mezhdu dostatochnym kolichestvom transkripcionnyh faktorov i motivov stalo vozmozhnym predskazyvat funkcii operona lezhashego poblizosti ot motiva po specifichnosti transkripcionnogo faktora s nim svyazyvayushegosya i naoborot predskazyvat transkripcionnyj faktor po genam v operone lezhashem ryadom s opredelyonnym motivom Sajty svyazyvaniya Regulyaciya transkripcii Harakternymi primerami regulyacii transkripcii osushestvlyaemoj s pomoshyu belka raspoznayushego specialnyj motiv yavlyayutsya Sajt purinovogo repressora PurR u Escherichia coli PurR svyazyvaetsya s posledovatelnostyu v 16 nukleotidov kotoraya raspolozhena pered i reguliruet transkripciyu genov otvetstvennyh za sintez purinovyh i pirimidinovyh nukleotidov Interesno chto u bakterii Bacillus subtilis evolyucionno dalyokoj ot kishechnoj palochki takzhe est purinovyj repressor ne gomologichnyj PurR Sajt laktoznogo operona Lac Laktoznyj operon kontroliruetsya repressorom LacI kotoryj svyazyvaya DNK prepyatstvuet transkripcii genov otvetstvennyh za katabolizm laktozy Regulyaciya translyacii Odnimi iz naibolee izvestnyh primerov regulyacii translyacii pri pomoshi motiv raspoznayushih regulyatorov yavlyayutsya Sajt posadki ribosomy prokariot posledovatelnost Shajn Dalgarno zdes svyazyvanie proishodit s riboproteinom Sajt posadki ribosomy eukariot posledovatelnost Kozak svyazyvanie proishodit s eukarioticheskim faktorom iniciacii translyacii eIF1 IRE regulyatornye elementy raspolagayushiesya na 5 UTR i ili 3 UTR mRNK fermentov k primeru ferritina reguliruyushie soderzhanie zheleza v kletke S etimi motivami svyazyvayutsya belki IRP1 citozolnaya forma akonitazy i IRP2 kataliticheski neaktivnyj gomolog akonitazy reguliruya samim faktom svoego svyazyvaniya s mRNK skorost eyo degradacii ili skorost translyacii proishodyashej s neyo Sila motiva Sila vzaimodejstviya belka ili RNK s DNK motivom zavisit v pervuyu ochered ot posledovatelnosti dannogo motiva Razlichayut silnye motivy dayushie silnoe vzaimodejstvie s belkom ili RNK i slabye motivy s kotorymi vzaimodejstvie slabee Prakticheski vsegda udayotsya poluchit tak nazyvaemuyu konsensusnuyu posledovatelnost konsensus to est takuyu posledovatelnost v kazhdoj pozicii kotoroj stoit bukva naibolee chasto vstrechayushayasya v sootvetstvuyushej pozicii v posledovatelnostyah motivov iz raznyh organizmov Konsensusnaya posledovatelnost prinimaetsya za samuyu silnuyu kakovoj ona pochti vsegda i yavlyaetsya Bolee slabye motivy poluchayutsya iz neyo s pomoshyu nebolshogo chashe vsego 1 3 chisla zamen Evolyuciya sily motiva V processe evolyucii sila motivov reguliruetsya s pomoshyu estestvennogo otbora prichyom motiv mozhet stanovitsya kak silnee tak i slabee Harakternym primerom takoj podstrojki sily motiva mozhet sluzhit izmenchivost posledovatelnosti Shajna Dalgarno ShD Est tesnaya korrelyaciya mezhdu neobhodimym organizmu kolichestvom transliruemogo belka i siloj ShD pered nim V sluchae s ShD hotya sila svyazyvaniya belka i napryamuyu korreliruet s siloj svyazyvaniya 16S subedinicy ribosomy v svyazi s osobennostyami iniciacii translyacii konsensusnaya posledovatelnost ne obyazatelno budet garantirovat naibolee effektivnuyu translyaciyu iz za zatrudnyonnogo uhoda ribosomy s sajta iniciacii Poetomu posledovatelnost Shajna Dalgarno chashe vsego soderzhit 4 5 nukleotidov iz konsensusnoj posledovatelnosti pri dline poslednej primerno v 7 nukleotidov RNK pereklyuchateli Ne vsegda nalichie motiva yavno vypolnyayushego biologicheski znachimuyu rol vlechyot za soboj nalichie belka regulyatora Regulyaciya takzhe mozhet osushestvlyatsya za schyot svyazyvaniya RNK s kakim libo nizkomolekulyarnym veshestvom Na etom principe postroeny struktury obrazuyushiesya na RNK vo vremya transkripcii sposobnye svyazyvat malye molekuly Svyazyvanie molekuly vliyaet na sposobnost ribopereklyuchatelya ostanavlivat transkripciyu ili prepyatstvovat translyacii V etom sluchae vazhnoj okazyvaetsya ne posledovatelnost nukleotidov kak takovaya a nalichie komplementarnyh nukleotidov na nuzhnyh mestah v posledovatelnosti Regulyaciya za schyot vtorichnoj struktury Regulyaciya translyacii takzhe mozhet osushestvlyatsya tolko za schyot obrazuemoj nukleinovoj kislotoj vtorichnoj struktury Ro nezavisimyj terminator transkripcii shpilka obrazuyushayasya na sinteziruemoj mRNK do nachala translyacii prepyatstvuyushaya dalnejshemu sintezu mRNK Terminator DNK IRES slozhnaya struktura v mRNK virusov eukariot obespechivayushij vnutrennyuyu iniciaciyu translyacii Struktura motiva Zachastuyu motivy svyazyvayushie transkripcionnye faktory imeyut vid pryamyh povtorov nekotoroj posledovatelnosti obratnyh povtorov ili palindromnyh posledovatelnostej Eto mozhno obyasnit rabotoj transkripcionnyh faktorov v vide dimerov belkov v kotoryh kazhdyj iz monomerov svyazyvaet odnu i tu zhe posledovatelnost Vstrechayutsya takzhe motivy bolshej povtornosti Takoe stroenie motivov obespechivaet bolshuyu rezkost reakcii na izmenenie vneshnih uslovij K primeru esli svyazyvanie zavisit ot koncentracii odnogo veshestva v kletke to poluchaem zavisimost sily reakcii kletki opisyvaemuyu uravneniem Mihaelisa Menten S uvelicheniem chisla svyazyvayushihsya edinic belka budem schitat chto dejstvie svyazyvaniya belka s motivom proyavlyaetsya tolko v sluchae svyazyvaniya so vsemi povtorami zavisimost vsyo bolshe stanovitsya pohozhej na sigmoidu v predele stremyas k funkcii Hevisajda opisyvayushej odin iz glavnyh principov reagirovaniya zhivyh sistem na mnogie vozdejstviya zakon vsyo ili nichego angl all or nothing law k primeru formirovaniya potenciala dejstviya Motivy v belkahDlya belkov sleduet razlichat motiv v posledovatelnosti aminokislot strukturnyj motiv vzaimnoe raspolozhenie neskolkih blizko raspolozhennyh elementov vtorichnoj struktury v prostranstve Na posledovatelnosti zhe eti elementy mogut daleko otstoyat drug ot druga Motivy v pervichnoj strukture posledovatelnosti belka Motivy v pervichnoj strukture pohozhi na motivy v nukleinovyh kislotah Harakternymi primerami takovyh yavlyayutsya signalnye peptidy korotkie aminokislotnye posledovatelnosti v sostave belka dlinoj poryadka 3 60 aminokislot opredelyayushie v kakoj kompartment kletki budet otpravlen posle sinteza Primer signal yadernoj lokalizacii sajty posttranslyacionnoj modifikacii belkov predstavlyayushie soboj konservativnye peptidy poryadka 5 12 aminokislot Primer sajty acetilirovaniya v belkeStrukturnye motivy V belkah strukturnye motivy opisyvayut svyazi mezhdu elementami vtorichnoj struktury Takie motivy chasto imeyut uchastki peremennoj dliny kotorye v nekotoryh sluchayah mogut i vovse otsutstvovat Lejcinovaya molniya harakteren dlya dimernyh belkov svyazyvayushih DNK Lejcinovaya molniya obespechivaet kontakt dvuh monomerov belka za schyot gidrofobnyh vzaimodejstvij Dlya nego harakterno nalichie v kazhdoj sedmoj pozicii ostatka lejcina Cinkovye palcy harakteren dlya DNK svyazyvayushih faktorov transkripcii Spiral povorot spiral DNK svyazyvayushij motiv imenno takoj DNK svyazyvayushij fragment u Lac repressora Gomeodomen motiv svyazyvayushij DNK i RNK U eukariot belki s gomeodomenami induciruyut differencirovku kletok zapuskaya kaskady genov neobhodimyh dlya obrazovaniya tkanej i organov Pohozh na motiv spiral povorot spiral potomu chasto otdelno ne vydelyaetsya Ukladka Rossmana motiv svyazyvayushij nukleotidy k primeru NAD Vstrechaetsya v chastnosti v degidrogenazah v tom chisle v uchastvuyushej v glikolize EF ruka motiv svyazyvayushij iony Sa2 takzhe podoben motivu spiral povorot spiral tri posledovatelnyh aminokislotnyh ostatka formiruyut sajt svyazyvaniya aniona tri posledovatelnyh aminokislotnyh ostatka formiruyut sajt svyazyvaniya kationa Beta shpilka dva b tyazha soedinyonnyh korotkim razvorotom cepi belka Krome beta shpilki vydelyayut i mnozhestvo drugih motivov funkciya kotoryh sostoit v formirovanii strukturnogo karkasa belka Blizkim k terminu strukturnyj motiv belka yavlyaetsya harakternoe raspolozhenie elementov vtorichnoj struktury V silu svoej shozhesti terminy chasto ispolzuyutsya odin vmesto drugogo i gran mezhdu nimi razmyta Predstavlenie motivovIznachalno imeetsya nabor motivov iz raznyh posledovatelnostej i stavitsya zadacha predstavit ih kompaktno i naglyadno umet po predstavleniyu motiva osushestvlyat poisk ego novyh vhozhdenij Sushestvuet neskolko obshepriznannyh sposobov predstavleniya motivov Chast iz nih podhodit kak dlya belkov tak i dlya nukleotidov drugaya chast tolko dlya belkov ili nukleotidov Konsensus Strogij konsensus Strogim konsensusom motiva nazovem strochku sostoyashuyu iz samyh predstavlennyh bukv v mnozhestve realizacij motiva Na praktike ukazyvaetsya ne prosto naibolee chastaya bukva v dannoj pozicii no i esli maksimalnaya chastota vstrechaemosti kakoj libo bukvy v dannoj pozicii menshe zadannogo poroga to na etom meste v konsensuse stavitsya x lyubaya bukva alfavita Po takomu konsensusu my pochti navernyaka nahodim posledovatelnosti realno yavlyayushiesya motivami no upuskaem bolshoe chislo motivov otlichayushihsya ot konsensusa na neskolko zamen Nizhe privedyon primer strogogo konsensusa dlya uchastka motiva pyati vzyatyh iz UniProt belkov s motivom lejcinovoj molnii porog byl vzyat ravnym 80 Nomer poziciiUniProt ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15O35048 L S P C G L R L I G A H P I LQ6XXX9 L G Q D I C D L F I A L D V LQ9N298 L G Q V T C D L F I A L D V LQ61247 L S P L S V A L A L S H L A LB0BC06 L T I G Q Y S L Y A I D G T LKonsensus L x x x x x x L x x x x x x LNestrogij konsensus Nestrogim konsensusom nazovem posledovatelnost spiskov bukv naibolee predstavlennyh na sootvetstvuyushem meste Opisyvayutsya vse ili naibolee chasto vstrechayushiesya bukvy v dannoj pozicii obychno ustanavlivaetsya minimalnyj porog chastoty Fakticheski motiv opisyvaetsya pri pomoshi regulyarnogo vyrazheniya V kachestve oboznachenij ispolzuyut Alfavit sovokupnost otdelnyh simvolov oboznachayushih opredelyonnuyu aminokislotu nukleotid ili nabor aminokislot nukleotidov ABC stroka iz simvolov alfavita oboznachayushaya posledovatelnost simvolov sleduyushih drug za drugom ABC lyubaya stroka simvolov vzyatyh iz alfavita v kvadratnyh skobkah sootvetstvuet lyubomu iz sootvetstvuyushih simvolov naprimer ABC sootvetstvuet ili A ili B ili C ABC DE lyubaya stroka simvolov vzyatyh iz alfavita sootvetstvuet lyuboj aminokislote krome teh chto nahodyatsya v figurnyh skobkah naprimer ABC sootvetstvuet lyuboj aminokislote krome A B i C x v nizhnem registre lyuboj simvol alfavita V sluchae s takim predstavleniem prihoditsya balansirovat mezhdu chuvstvitelnostyu konsensusa kolichestvom realnyh motivov kotorye im poluchitsya otyskat i specifichnostyu sposobnostyu metoda otbrakovyvat musornye posledovatelnosti Nizhe priveden primer nestrogo konsensusa dlya teh zhe pyati posledovatelnostej belkov chto i dlya strogo konsensusa porog byl vzyat ravnym 20 Vidim chto v pozicii 10 motiv ne sovsem obektiven lejcin L i izolejcin I ochen blizkie po svojstvam aminokisloty i logichno bylo by ih obe zanesti v konsensus Nomer poziciiUniProt ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15O35048 L S P C G L R L I G A H P I LQ6XXX9 L G Q D I C D L F I A L D V LQ9N298 L G Q V T C D L F I A L D V LQ61247 L S P L S V A L A L S H L A LB0BC06 L T I G Q Y S L Y A I D G T LKonsensus L SG PQ x x C D L F I A LH D V LProsite konsensus dlya belkov PROSITE ispolzuet IYuPAK dlya oboznacheniya odnobukvennyh kodov aminokislot za isklyucheniem simvola konkatenacii ispolzuemogo mezhdu elementami patterna Pri ispolzovanii PROSITE dobavlyaetsya neskolko simvolov oblegchayushih predstavlenie belkovogo motiva lt shablon ogranichivaetsya N koncom posledovatelnosti gt shablon ogranichivaetsya C koncom posledovatelnosti Esli e shablon elementa i m i n dva desyatichnyh celyh chisla i m lt n to e m ekvivalentno povtoreniyu e rovno m raz e m n ekvivalentno povtoreniyu e rovno k raz dlya lyubogo celogo k udovletvoryayushego usloviyu m lt k lt n Primer motiv domena s signaturoj C2H2 type cinkovogo palca vyglyadit sleduyushim obrazom C x 2 4 C x 3 LIVMFYWC x 8 H x 3 5 H Pozicionnaya vesovaya matrica Osnovnaya statya Pozicionnaya vesovaya matrica Pozicionnoj vesovoj matricej nazyvaetsya takaya matrica stolbcy kotoroj sootvetstvuyut pozicii v posledovatelnosti a strochki sootvetstvuyut bukvam v alfavite Znacheniyami etoj matricy yavlyayutsya chastoty ili monotonnye funkcii ot chastot vstrechaemosti dannoj bukvy v dannoj pozicii na posledovatelnosti Pri etom obychno chtoby isklyuchit nulevye chastoty k chislu vstrech kazhdoj bukvy pozicii dobavlyayut nekotoroe chislo ishodya iz apriornogo raspredeleniya bukv v podobnyh posledovatelnostyah k primeru vvodyat popravku Laplasa Dannyj podhod kak i predydushie neyavno predpolagaet chto pozicii v motive nezavisimy chego na samom dele ne nablyudaetsya dazhe dlya nukleotidnyh posledovatelnostej Pust u nas est 7 posledovatelnostej DNK predstavlyayushih soboj motiv Nomer poziciiNomer posledovatelnosti 1 2 3 4 5 6 7 81 A T C C A G C T2 G G G C A A C T3 A T G G A T C T4 A A G C A A C C5 T T G G A A C T6 A T G C C A T T7 A T G G C A C T Pozicionnaya matrica dlya nih budet imet sleduyushij vid 1 uchyot pravila Laplasa Nomer poziciiNukleotid 1 2 3 4 5 6 7 8A 5 1 1 1 0 1 0 1 5 1 5 1 0 1 0 1C 1 1 0 1 1 1 4 1 2 1 0 1 6 1 1 1G 0 1 1 1 6 1 3 1 0 1 1 1 0 1 0 1T 1 1 5 1 0 1 0 1 0 1 1 1 1 1 6 1 Chastoty mozhno pronormirovat na obshee chislo posledovatelnost tem samym poluchiv ocenku veroyatnosti vstrechi dannogo nukleotida v dannoj posledovatelnosti sobstvenno obychno v takom predstavlenii i hranitsya PWM Nomer poziciiNukleotid 1 2 3 4 5 6 7 8A 0 55 0 18 0 09 0 09 0 55 0 55 0 09 0 09C 0 18 0 09 0 18 0 45 0 27 0 09 0 64 0 18G 0 09 0 18 0 64 0 36 0 09 0 18 0 09 0 09T 0 18 0 55 0 09 0 09 0 09 0 18 0 18 0 64HMM skrytye markovskie modeli Skrytaya markovskaya model nulevogo poryadka dlya privedyonnyh vyshe posledovatelnostej odnogo motiva Kazhdoe sostoyanie sootvetstvuet odnoj iz pozicij veroyatnost perehoda iz odnogo sostoyaniya v drugoe ravna 1 Emissionnye veroyatnosti dlya nukleotidov izobrazheny na sostoyaniyah Dlya bolshej tochnosti mozhno uchityvat zavisimost sosednih pozicij v motive s pomoshyu skrytyh markovskih modelej pervogo i bolee vysokih poryadkov Etot podhod sopryazhyon s nekotorymi trudnostyami tak kak dlya ego primeneniya neobhodimo nalichie dostatochno predstavitelnoj vyborki variantov motivov V sluchae predydushego primera imeem Dlya markovskoj modeli poryadka 0 veroyatnost poyavleniya nukleotida v dannoj pozicii ot drugih pozicij ne zavisit drugoj sposob traktovki PWM Skrytaya markovskaya model pervogo poryadka dlya privedyonnyh vyshe posledovatelnostej odnogo motiva Kazhdoe sostoyanie sootvetstvuet nukleotidu v odnoj iz pozicij veroyatnost perehoda iz odnogo sostoyaniya vo drugoe ravna veroyatnosti poyavleniya posle nukleotida sootvetstvuyushego etomu sostoyaniyu nukleotida sootvetstvuyushego drugomuDlya markovskoj modeli poryadka 1 veroyatnost poyavleniya nukleotida v dannoj pozicii zavisit tolko ot nukleotida v predydushej posledovatelnosti Chislo parametrov modeli silno vozroslo Pri raschyote veroyatnostej perehoda takzhe ispolzovalos pravilo Laplasa Emisionnye veroyatnosti dlya sostoyanij ravny 1 dlya nukleotidov kotorym oni sootvetstvuyut 0 dlya ostalnyh V sluchae motivov soderzhashih uchastki peremennogo razmera i nukleotidnogo sostava mozhno bylo by vvodit otdelno model dlya etih uchastkov otdelno dlya konservativnyh a zatem skleivat ih v odnu model putyom dobavleniya promezhutochnyh molchashih sostoyanij i veroyatnostej perehoda v nih i iz nih SKS stohasticheskaya kontekstno svobodnaya grammatika V sluchae motivov formiruyushih vtorichnye struktury RNK pereklyuchateli v RNK v elementah vtorichnoj struktury vazhno uchityvat vozmozhnost sparivaniya nukleotidov S etoj zadachej spravlyayutsya SKS Odnako obuchenie SKS trebuet eshyo bolshego razmera vyborki chem HMM i sopryazheno s ryadom trudnostej Predstavlenie dlya bolshih bazah dannyh V teh sluchayah kogda vazhna skorost poiska i dopustim propusk nekotoryh vhozhdenij nashego motiva issledovateli pribegayut k razlichnym ulovkam pozvolyayushim s priemlemoj tochnostyu zashifrovat prostranstvennuyu struktur biopolimera RNK ili belka putyom rasshireniya alfavita Predstavlenie motivov v belkah s pomoshyu kodirovaniya prostranstvennoj struktury belka Operon Escherichia coli repressor laktozy LacI PDB 1lcc chain A i gen aktivator katabolizma PDB 3gap chain A oba imeyut motiv spiral povorot spiral no ih aminokislotnye posledovatelnosti ne ochen shozhi Gruppoj issledovatelej byl razrabotan kod kotoryj oni nazvali tryohmernyj kod cepi predstavlyayushij strukturu belka v vide stroki iz pisem Eta shema kodirovaniya po mneniyu avtorov pokazyvaet shodstvo mezhdu belkami gorazdo bolee otchyotlivo chem aminokislotnye posledovatelnosti Primer sravnenie dvuh upomyanutyh vyshe belkov pri pomoshi etoj shemy kodirovaniya PDB ID 3D code Amino acid sequence i b 1lccA b i TWWWWWWWKCLKWWWWWWG LYDVAEYAGVSYQTVSRVV i b 3gapA b i KWWWWWWGKCFKWWWWWWW RQEIGQIVGCSRETVGRILSravnenie Vidno yavnoe shodstvo mezhdu belkami Po aminokislotnoj posledovatelnosti belki silno otlichayutsya gde W sootvetstvuet a spirali i E i D sootvetstvuet b niti Predstavlenie motivov v RNK s pomoshyu vtorichnoj struktury foldedBlast V dannoj rabote s celyu primeneniya algoritma poiska shozhego s BLAST nukleotidnyj alfavit ATGC tak kak poisk osushestvlyalsya v genome byl rasshiren za schyot kombinirovaniya nukleotidov i treh simvolov harakterizuyushih ih predpolozhitelnoe napravlenie sparivaniya nukleotid sparen s nukleotidom sprava nukleotid sparen s nukleotidom sleva nukleotid ne sparen Takim obrazom poluchalos 12 bukv novogo alfavita 4 nukleotida 3 napravleniya pri pravilnom ispolzovanii pozvolyayushij osushestvlyat BLAST podobnyj poisk nazvannyj avtorami foldedBlast Logotip posledovatelnostej Osnovnaya statya Logotip posledovatelnostej Motiv sajta svyazyvaniya purinovogo repressora PurR iz Escherichia coli Poluchen s pomoshyu paketa R seqLogo Dlya vizualnogo predstavleniya motivov chasto ispolzuyut logotip posledovatelnostej graficheskogo predstavleniya konservativnosti kazhdoj pozicii v motive Pri etom dannuyu vizualizaciyu mozhno uspeshno primenyat kak i v sluchae predstavleniya motiva v vide konsensusa ili pozicionnoj vesovoj matricy tak i dlya predstavleniya HMM modeli posledovatelnosti kak eto sdelano v baze belkovyh semejstv Pfam Krome togo esli ispolzovat k primeru yarkost kazhdoj nukleotida v motive kak indikator togo naskolko chasto emu sootvetstvuet v etom zhe motive komplementarnyj nukleotid to mozhno chastichno predstavlyat i informaciyu o vtorichnoj strukture motiva Tak sdelano naprimer v bioinformaticheskom veb servise RegPredict Poisk sajtov svyazyvaniya transkripcionnyh faktorov in silicoOsnovnaya statya Poisk sajtov svyazyvaniya transkripcionnyh faktorov in silico V sluchae poiska v nukleotidnyh posledovatelnostyah motivov otvechayushih za svyazyvanie regulyatornyh belkov polzuyutsya soobrazheniem chto oni motivy menyayutsya sravnitelno medlenno a znachit esli vzyat organizmy dostatochno dalyokie drug ot druga chtoby v vysokovariabelnyh poziciyah ih posledovatelnostej uspeli nakopitsya mutacii a sajty izmenitsya silno eshyo ne uspeli to mozhno polzovatsya pravilom chto konservativno to vazhno Posle polucheniya posledovatelnostej v kotoryh predpolagaetsya nalichiya specifichnogo motiva v osnovnom ispolzuyut dva podhoda k poisku posledovatelnosti motiva filogeneticheskij futprinting i svedenie zadachi k zadache poiska vstavlennogo motiva Filogeneticheskij futprinting Filogeneticheskij futprinting poluavtomaticheskij metod Posledovatelnosti obrabatyvayutsya programmoj mnozhestvennogo vyravnivaniya i v poluchivshemsya vyravnivanii issledovatelem ishutsya patterny kotorye mozhno schitat motivami Odnim iz naibolee uspeshnyh primerov primeneniya dannogo podhoda mozhno schitat rasshifrovku sposoba kodirovaniya neribosomnyh peptidov neribosomnymi peptid sintetazami NRPS Dannyj metod ne pozvolyaet polnostyu avtomatizirovat process poiska motivov no pri etom i ne imeet stol silnyh ogranichenij kak sleduyushie Zadacha poiska vstavlennogo motiva V sluchae s motivami bez pochti bez razryvov i bez pochti bez uchastkov peremennoj dliny vozmozhno svesti zadachu poiska motiva k zadache poiska vstavlennogo motiva angl Planted motif search Formulirovka zadachi sleduyushaya Na vhod predostavleny n strok s1 s2 sn dliny m kazhdaya sostavlennaya iz simvolov alfavita A i dva chisla l i d Najdite vse stroki x dliny l takie chto lyubaya iz predostavlennyh stroki soderzhit hotya by odnu podposledovatelnost nahodyashuyusya ot x na rasstoyanii Hemminga ne bolshe d Tak kak v obshem sluchae neizvestno vse li poluchennye nami posledovatelnosti imeyut iskomyj motiv a takzhe neizvestna ego tochnaya dlina to obychno zadachu reshayut evristicheskimi metodami maksimiziruya veroyatnost najdennogo motiva pri dannyh posledovatelnostyah Na etom principe postroeny programmy MEME i GibbsSampler Esli zadat minimalnyj porog na chislo posledovatelnostej v kotoryh dolzhen soderzhatsya motiv i kak libo ogranichit ego dlinu to mozhno ispolzovat i tochnye sposoby resheniya dannoj zadachi k primeru algoritm RISOTTO Nekotorye iz nih pozvolyayut snimat chast ogranichenij na iskomyj motiv v RISOTTO iskomyj motiv mozhet imet razryvy sostoyat iz neskolkih chastej Odnako eti metody redko dayut rezultaty luchshe chem MEME i GibbsSamler a rabotayut oni znachitelno dolshe Poisk sajtov svyazyvaniya in vitroChIP seq Osnovnaya statya ChIP seq Metod analiza DNK belkovyh vzaimodejstvij kombiniruyushij idei immunoprecipitacii hromatina ChIP i vysokoeffektivnom sekvenirovanii DNK belok prishivaetsya k DNK zatem kusochki DNK prishivshiesya k belku otpravlyayutsya na sekvenirovanie V hode raboty metoda poluchayutsya uchastki dlinoj okolo 150 nukleotidov kotorye zatem mozhno analizirovat in silico na nalichie motiva ChIP on chip Kak i v sluchae ispolzovaniya metoda ChIP seq provoditsya immunoprecipitacii hromatina ChIP zatem sshivka s belkom obrashaetsya i poluchennaya DNK gibridizuetsya s DNK mikrochipom Metod ChIP on chip deshevle chem ChIP seq odnako silno ustupaet poslednemu v tochnosti ChIP exo Takzhe metod osnovannyj na immunoprecipitacii hromatina ChIP Ispolzovanie ekzonukleazy faga l degradiruyushej DNK tolko s 5 konca i tolko v sluchae otsutstviya kontakta s belkom pozvolyaet dobivatsya tochnosti poryadka neskolkih nukleotidov v opredelenii polozheniya sajta svyazyvaniya belka SELEX Osnovnaya statya SELEX Iterativnyj metod poiska nukleotidnyh posledovatelnostej horosho svyazyvayushihsya s dannym belkom Procedura v obshem sluchae vyglyadit tak Interesuyushij nas belok prishivaetsya k kolonke cherez kotoruyu dalee propuskaetsya rastvor s naborom posledovatelnostej sostoyashih iz randomizirovannogo uchastka i adaptera Posledovatelnosti zaderzhavshiesya na kolonke kloniruyut procedure PCR prichem sostav reakcionnoj smesi podobran takim obrazom chtoby vnosit dopolnitelnye oshibki pri kopirovanii Poluchennye klony otpravlyayutsya na novyj raund SELEX Cherez kazhdye neskolko uchastkov usloviya pH rastvora ego ionnaya sila uzhestochayutsya chtoby na kolonke ostavalis vse bolee i bolee specifichnye k belku posledovatelnosti Poluchayushiesya na vyhode posledovatelnosti chasto pohozhi na realnye motivy svyazyvaniya belka v zhivyh organizmah DamID Delaetsya gibridnyj belok iz izuchaemogo belka i adeninovoj DNK metiltransferazy Dam V estestvennyh usloviyah adenin v bolshinstve eukariot ne metiliruetsya Kogda zhe gibridnyj belok svyazyvaetsya s kakim libo sajtom v DNK organizma metiltransferaznaya chast modificiruet adeniny v rajone etogo sajta chto pozvolyaet zatem s pomoshyu endonukleaz restrikcii vydelit uchastok na kotorom s bolshoj dolej veroyatnosti nahoditsya iskomyj motiv PrimechaniyaD haeseleer Patrik What are DNA sequence motifs angl Nature Biotechnology 2006 1 April vol 24 iss 4 P 423 425 ISSN 1087 0156 doi 10 1038 nbt0406 423 Arhivirovano 12 aprelya 2017 goda Compeau Phillip Pevzner Pavel Bioinformatics Algorithms An Active Learning Approach 2nd Ed Vol 1 by Phillip Compeau angl 2nd edition Active Learning Publishers 2015 384 p ISBN 9780990374619 Koonin Eugene V The Logic of Chance The Nature and Origin of Biological Evolution 1 edition FT Press 2011 06 23 529 s ISBN 978 0132542494 Durbin Richard Eddy Sean R Krogh Anders Mitchison Graeme Biological Sequence Analysis Probabilistic Models of Proteins and Nucleic Acids Cambridge University Press 1998 372 s ISBN 978 0521620413 Purine repressor Proteopedia life in 3D angl proteopedia org Data obrasheniya 11 aprelya 2017 Arhivirovano 12 aprelya 2017 goda Alberts Bruce Johnson Alexander Lewis Julian Raff Martin Roberts Keith Molecular Biology of the Cell 4th Garland Science 2002 01 01 ISBN 0815332181 ISBN 0815340729 Arhivirovano 27 sentyabrya 2017 goda Pestova T V Kolupaeva V G Lomakin I B Pilipenko E V Shatsky I N Molecular mechanisms of translation initiation in eukaryotes angl Proceedings of the National Academy of Sciences of the United States of America 2001 19 June vol 98 iss 13 P 7029 7036 ISSN 0027 8424 doi 10 1073 pnas 111145798 Arhivirovano 23 aprelya 2017 goda Evfratov Sergey A Osterman Ilya A Komarova Ekaterina S Pogorelskaya Alexandra M Rubtsova Maria P Application of sorting and next generation sequencing to study 5 UTR influence on translation efficiency in Escherichia coli angl Nucleic Acids Research 2017 7 April vol 45 iss 6 P 3487 3502 ISSN 0305 1048 doi 10 1093 nar gkw1141 Arhivirovano 12 aprelya 2017 goda Jones Neil C Pevzner Pavel A An Introduction to Bioinformatics Algorithms 1 edition The MIT Press 2004 435 s ISBN 9780262101066 Gilbert W Maxam A The nucleotide sequence of the lac operator angl Proceedings of the National Academy of Sciences 1973 December vol 70 iss 12 P 3581 3584 PMID 4587255 Arhivirovano 24 aprelya 2017 goda Maniatis T Ptashne M Backman K Kield D Flashman S Jeffrey A Maurer R Recognition sequences of repressor and polymerase in the operators of bacteriophage lambda angl Cell 1975 June vol 5 iss 2 P 109 113 PMID 1095210 Arhivirovano 24 aprelya 2017 goda Sanger F Nicklen S Coulson AR DNA sequencing with chain terminating inhibitors angl Proceedings of the National Academy of Sciences 1977 December vol 74 iss 12 P 5463 5467 Arhivirovano 2 aprelya 2017 goda Stormo GD DNA binding sites representation and discovery angl Bioinformatics 2000 January vol 16 iss 1 P 16 23 Arhivirovano 19 aprelya 2017 goda Stormo GD Schneider TD Gold LM Characterization of translational initiation sites in E coli angl Nucleic Acids Research 1982 11 May vol 10 iss 9 P 2971 2996 Arhivirovano 24 aprelya 2017 goda Galas DJ Eggert M Waterman MS Rigorous pattern recognition methods for DNA sequences Analysis of promoter sequences from Escherichia coli angl Journal of Molecular Biology 1985 5 November vol 186 no 1 P 117 128 Arhivirovano 24 aprelya 2017 goda Stormo GD DNA binding sites representation and discovery angl Bioinformatics 2000 January vol 16 no 1 P 16 23 Arhivirovano 19 aprelya 2017 goda T L Bailey C Elkan The value of prior knowledge in discovering motifs with MEME angl Proceedings International Conference on Intelligent Systems for Molecular Biology 1995 1 January vol 3 P 21 29 ISSN 1553 0833 Arhivirovano 24 aprelya 2017 goda Lawrence CE1 Altschul SF Boguski MS Liu JS Neuwald AF Wootton JC Detecting subtle sequence signals a Gibbs sampling strategy for multiple alignment angl Science 1993 8 October vol 262 no 5131 P 208 214 Arhivirovano 24 aprelya 2017 goda Jendresen Christian Bille Martinussen Jan Kilstrup Mogens The PurR regulon in Lactococcus lactis transcriptional regulation of the purine nucleotide metabolism and translational machinery angl Microbiology Reading England 2012 1 August vol 158 iss 8 P 2026 2038 ISSN 1465 2080 doi 10 1099 mic 0 059576 0 Arhivirovano 19 aprelya 2017 goda Sinha Sangita C Krahn Joseph Shin Byung Sik Tomchick Diana R Zalkin Howard The purine repressor of Bacillus subtilis a novel combination of domains adapted for transcription regulation angl Journal of Bacteriology 2003 1 July vol 185 iss 14 P 4087 4098 ISSN 0021 9193 doi 10 1128 JB 185 14 4087 4098 2003 Arhivirovano 19 aprelya 2017 goda Shine J Dalgarno L Terminal sequence analysis of bacterial ribosomal RNA Correlation between the 3 terminal polypyrimidine sequence of 16 S RNA and translational specificity of the ribosome angl European Journal of Biochemistry 1975 1 September vol 57 iss 1 P 221 230 ISSN 0014 2956 Arhivirovano 19 aprelya 2017 goda Nelson David L Cox Michael M Lehninger Principles of Biochemistry 7 edition W H Freeman 2017 01 01 1328 s ISBN 9781464126116 Stormo G D Schneider T D Gold L Quantitative analysis of the relationship between nucleotide sequence and functional activity angl Nucleic Acids Research 1986 26 August vol 14 iss 16 P 6661 6679 ISSN 0305 1048 Arhivirovano 19 aprelya 2017 goda Stormo G D DNA binding sites representation and discovery angl Bioinformatics Oxford England 2000 1 January vol 16 iss 1 P 16 23 ISSN 1367 4803 Arhivirovano 19 aprelya 2017 goda Shultzaberger Ryan K Zehua Chen Lewis Karen A Schneider Thomas D Anatomy of Escherichia coli s 70 promoters angl Nucleic Acids Research 2007 1 February vol 35 iss 3 P 771 788 ISSN 1362 4962 doi 10 1093 nar gkl956 Arhivirovano 19 aprelya 2017 goda J Shine L Dalgarno Terminal sequence analysis of bacterial ribosomal RNA Correlation between the 3 terminal polypyrimidine sequence of 16 S RNA and translational specificity of the ribosome angl European Journal of Biochemistry 1975 1 September vol 57 iss 1 P 221 230 ISSN 0014 2956 Arhivirovano 19 aprelya 2017 goda Ribopereklyuchatel RNK pereklyuchatel riboswitch rus humbio ru Data obrasheniya 11 aprelya 2017 Arhivirovano 12 aprelya 2017 goda Samuel E Bocobza Asaph Aharoni Small molecules that interact with RNA riboswitch based gene control and its involvement in metabolic regulation in plants and algae angl The Plant Journal For Cell and Molecular Biology 2014 1 August vol 79 iss 4 P 693 703 ISSN 1365 313X doi 10 1111 tpj 12540 Arhivirovano 19 aprelya 2017 goda Hironori Otaka Hirokazu Ishikawa Teppei Morita Hiroji Aiba PolyU tail of rho independent terminator of bacterial small RNAs is essential for Hfq action angl Proceedings of the National Academy of Sciences of the United States of America 2011 9 August vol 108 iss 32 P 13059 13064 ISSN 0027 8424 doi 10 1073 pnas 1107050108 Arhivirovano 3 iyulya 2022 goda Hiroshi Yamamoto Marianne Collier Justus Loerke Jochen Ismer Andrea Schmidt Molecular architecture of the ribosome bound Hepatitis C Virus internal ribosomal entry site RNA angl The EMBO Journal 2015 14 December vol 34 iss 24 P 3042 3058 ISSN 0261 4189 doi 10 15252 embj 201592469 Kamkin Andrej Kamenskij Andrej Aleksandrovich Fundamentalnaya i klinicheskaya fiziologiya Academia 2004 01 01 1072 s ISBN 5769516755 Structural Motifs EMBL EBI Train online angl 25 noyabrya 2011 Arhivirovano 12 aprelya 2017 Data obrasheniya 12 aprelya 2017 Gonter Blobel Bernhand Dobberstein Transfer of proteins across membranes I Presence of proteolytically processed and unprocessed nascent immunoglobulin light chains on membrane bound ribosomes of murine myeloma angl The Journal of Cell Biology 1975 1 December vol 67 iss 3 P 835 851 ISSN 0021 9525 Arhivirovano 2 aprelya 2022 goda Qiu Wang Ren Sun Bi Qian Xiao Xuan Xu Zhao Chun Chou Kuo Chen iPTM mLys identifying multiple lysine PTM sites and their different types angl Bioinformatics Oxford England 2016 15 October vol 32 iss 20 P 3116 3123 ISSN 1367 4811 doi 10 1093 bioinformatics btw380 Arhivirovano 19 aprelya 2017 goda Landschulz W H Johnson P F McKnight S L The leucine zipper a hypothetical structure common to a new class of DNA binding proteins angl Science New York N Y 1988 24 June vol 240 iss 4860 P 1759 1764 ISSN 0036 8075 Arhivirovano 19 aprelya 2017 goda Klug A Rhodes D Zinc fingers a novel protein fold for nucleic acid recognition angl Cold Spring Harbor Symposia on Quantitative Biology 1987 1 January vol 52 P 473 482 ISSN 0091 7451 Arhivirovano 19 aprelya 2017 goda Burglin Thomas R Affolter Markus Homeodomain proteins an update angl Chromosoma 2016 1 January vol 125 P 497 521 ISSN 0009 5915 doi 10 1007 s00412 015 0543 8 Arhivirovano 8 marta 2021 goda Rao S T Rossmann M G Comparison of super secondary structures in proteins angl Journal of Molecular Biology 1973 15 May vol 76 iss 2 P 241 256 ISSN 0022 2836 Arhivirovano 23 aprelya 2017 goda Nelson Melanie R Thulin Eva Fagan Patricia A Forsen Sture Chazin Walter J The EF hand domain A globally cooperative structural unit angl Protein Science A Publication of the Protein Society 2017 14 April vol 11 iss 2 P 198 205 ISSN 0961 8368 doi 10 1110 ps 33302 Watson James D Milner White E James A novel main chain anion binding site in proteins the nest A particular combination of f ps values in successive residues gives rise to anion binding sites that occur commonly and are found often at functionally important regions1 angl Journal of Molecular Biology 2002 11 January vol 315 iss 2 P 171 182 doi 10 1006 jmbi 2001 5227 Torrance Gilleain M David P Leader Gilbert David R Milner White E James A novel main chain motif in proteins bridged by cationic groups the niche angl Journal of Molecular Biology 2009 30 January vol 385 iss 4 P 1076 1086 ISSN 1089 8638 doi 10 1016 j jmb 2008 11 007 Arhivirovano 23 aprelya 2017 goda Milner White E J Poet R Four classes of beta hairpins in proteins angl Biochemical Journal 1986 15 November vol 240 iss 1 P 289 292 ISSN 0264 6021 Efimov Alexander V Favoured structural motifs in globular proteins angl Structure 1994 1 November vol 2 iss 11 P 999 1002 doi 10 1016 S0969 2126 94 00102 2 Holm L Sander C Dictionary of recurrent domains in protein structures angl Proteins 1998 1 October vol 33 iss 1 P 88 96 ISSN 0887 3585 Arhivirovano 23 aprelya 2017 goda Schneider T D Stephens R M Sequence logos a new way to display consensus sequences angl Nucleic Acids Research 1990 25 October vol 18 iss 20 P 6097 6100 ISSN 0305 1048 Arhivirovano 20 aprelya 2017 goda de Castro Edouard Sigrist Christian J A Gattiker Alexandre Bulliard Virgini Langendijk Genevaux Petra S ScanProsite detection of PROSITE signature matches and ProRule associated functional and structural residues in proteins angl Nucleic Acids Research 2006 1 July vol 34 iss Web Server issue P W362 365 ISSN 1362 4962 doi 10 1093 nar gkl124 Arhivirovano 6 oktyabrya 2016 goda InterPro EMBL EBI Zinc finger C2H2 type IPR013087 lt InterPro lt EMBL EBI angl www ebi ac uk Data obrasheniya 15 aprelya 2017 Arhivirovano 15 aprelya 2017 goda Flah Peter Mashinnoe obuchenie Nauka i iskusstvo postroeniya algoritmov kotorye izvlekayut znaniya iz dannyh Uchebnik DMK Press 2015 01 01 400 s ISBN 9785970602737 9781107096394 Matsuda H Taniguchi F Hashimoto A An approach to detection of protein structural motifs using an encoding scheme of backbone conformations angl Pacific Symposium on Biocomputing Pacific Symposium on Biocomputing 1997 1 January P 280 291 ISSN 2335 6936 Arhivirovano 23 aprelya 2017 goda Tseng Huei Hun Weinberg Zasha Gore Jeremy Breaker Ronald r Ruzzo Walter l Finding non coding rnas through genome scale clustering angl Journal of bioinformatics and computational biology 2017 12 April vol 7 iss 2 P 373 388 ISSN 0219 7200 Schuster Bockler Benjamin Jorg Schultz Rahmann Sven HMM Logos for visualization of protein families angl BMC Bioinformatics 2004 1 January vol 5 P 7 ISSN 1471 2105 doi 10 1186 1471 2105 5 7 Novichkov Pavel S Rodionov Dmitry A Stavrovskaya Elena D Novichkova Elena S Kazakov Alexey E RegPredict an integrated system for regulon inference in prokaryotes by comparative genomics approach angl Nucleic Acids Research 2010 1 July vol 38 iss Web Server issue P W299 307 ISSN 1362 4962 doi 10 1093 nar gkq531 Arhivirovano 24 aprelya 2017 goda Marahiel Mohamed A Multidomain enzymes involved in peptide synthesis angl FEBS Letters 1992 27 July vol 307 iss 1 P 40 43 ISSN 1873 3468 doi 10 1016 0014 5793 92 80898 Q Arhivirovano 12 aprelya 2017 goda Stachelhaus T Mootz H D Marahiel M A The specificity conferring code of adenylation domains in nonribosomal peptide synthetases angl Chemistry amp Biology 1999 1 August vol 6 iss 8 P 493 505 ISSN 1074 5521 doi 10 1016 S1074 5521 99 80082 9 Arhivirovano 19 aprelya 2017 goda Keich U Pevzner P A Finding motifs in the twilight zone angl Bioinformatics Oxford England 2002 1 October vol 18 iss 10 P 1374 1381 ISSN 1367 4803 Arhivirovano 19 aprelya 2017 goda Thompson William A Newberg Lee A Conlan Sean McCue Lee Ann Lawrence Charles E The Gibbs Centroid Sampler angl Nucleic Acids Research 2007 1 July vol 35 iss Web Server issue P W232 237 ISSN 1362 4962 doi 10 1093 nar gkm265 Carvalho A M Freitas A T Oliveira A L Sagot M F An efficient algorithm for the identification of structured motifs in DNA promoter sequences angl IEEE ACM Transactions on Computational Biology and Bioinformatics 2006 1 April vol 3 iss 2 P 126 140 ISSN 1545 5963 doi 10 1109 TCBB 2006 16 Arhivirovano 8 sentyabrya 2017 goda Dinh Hieu Rajasekaran Sanguthevar Davila Jaime qPMS7 A Fast Algorithm for Finding ℓ d Motifs in DNA and Protein Sequences angl PLOS ONE 2012 24 July vol 7 iss 7 ISSN 1932 6203 doi 10 1371 journal pone 0041425 Arhivirovano 15 iyunya 2022 goda Johnson David S Mortazavi Ali Myers Richard M Wold Barbara Genome wide mapping of in vivo protein DNA interactions angl Science New York N Y 2007 8 June vol 316 iss 5830 P 1497 1502 ISSN 1095 9203 doi 10 1126 science 1141319 Arhivirovano 24 aprelya 2017 goda Rhee Ho Sung Pugh B Franklin Comprehensive genome wide protein DNA interactions detected at single nucleotide resolution angl Cell 2011 9 December vol 147 iss 6 P 1408 1419 ISSN 1097 4172 doi 10 1016 j cell 2011 11 013 Arhivirovano 24 aprelya 2017 goda Tuerk C Gold L Systematic evolution of ligands by exponential enrichment RNA ligands to bacteriophage T4 DNA polymerase angl Science New York N Y 1990 3 August vol 249 iss 4968 P 505 510 ISSN 0036 8075 Arhivirovano 24 aprelya 2017 goda Greil Frauke Moorman Celine van Steensel Bas DamID mapping of in vivo protein genome interactions using tethered DNA adenine methyltransferase angl Methods in Enzymology 2006 1 January vol 410 P 342 359 ISSN 0076 6879 doi 10 1016 S0076 6879 06 10016 6 Arhivirovano 24 aprelya 2017 goda LiteraturaDurbin R Eddi Sh Krog A Mitchison G Analiz biologicheskih posledovatelnostej Biological Sequence Analysis Probabilistic Models of Proteins and Nucleic Acids Regulyarnaya i haoticheskaya dinamika Institut kompyuternyh issledovanij 2006 S 480 ISBN 5939725597 Jones Neil C Pevzner Pavel A An Introduction to Bioinformatics Algorithms angl The MIT Press 2004 ISBN 9780262101066 Compeau Phillip Pevzner Pavel Bioinformatics Algorithms An Active Learning Approach 2nd Ed Vol 1 by Phillip Compeau angl Active Learning Publishers 2015 P 384 ISBN 9780990374619 Durbin Richard Eddy Sean R Krogh Anders Mitchison Graeme Biological Sequence Analysis Probabilistic Models of Proteins and Nucleic Acids angl Cambridge University Press 1998 P 372 ISBN 978 0521620413 Nelson David L Cox Michael M Lehninger Principles of Biochemistry angl W H Freeman 2017 P 1328 ISBN 9781464126116 SsylkiVideokursy po dannoj teme Nahodim skrytye v DNK soobsheniya chast kursa po bioinformatike ot vsemirno izvestnogo uchyonogo P A PevzneraServisy poiska motivov MEME Suite of motif based sequence analysis tools servis dlya poiska motivov v posledovatelnostyah odnoimyonnym algoritmom MEME The Gibbs Motif Sampler servis dlya poiska motivov v posledovatelnostyah algoritmom Gibbs Sampler RISOTTO motif discovery tool glavnaya stranica programmy dlya tochnogo poiska motivov RISOTTO PMS tochnyj poisk motivov pri pomoshi algoritmov semejstva PMS Bioprospector poisk motivov v posledovatelnostyah algoritmom Gibbs Sampler XXmotif servis dlya poisk motivov v nukleotidnyh posledovatelnostyah na osnovanii pryamoj optimizacii statisticheskoj znachimosti PWMBazy dannyh motivov PROSITE baza dannyh belkovyh semejstv i domenov TRANSFAC kommercheskaya ogranichennyj publichnyj dostup baza dannyh transkripcionnyh faktorov HOCOMOCO Arhivnaya kopiya ot 6 iyunya 2013 na Wayback Machine kollekciya traskripcionnyh faktorov cheloveka i myshi Minimotif Miner poisk korotkih izvestnyh motivovProchee Wikiomic Sequence motifs page statya o motivah v posledovatelnostyah Cis analysis spisok i korotkie opisaniya chasti programm poiska motivov v posledovatelnostyahEta statya vhodit v chislo horoshih statej russkoyazychnogo razdela Vikipedii

NiNa.Az

NiNa.Az - Абсолютно бесплатная система, которая делится для вас информацией и контентом 24 часа в сутки.
Взгляните
Закрыто