Промотор

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
1: РНК-полимераза, 2: Репрессор, 3: Промотор, 4: Оператор, 5: Лактоза, 6: lacZ, 7: lacY, 8: lacA.
Верх: Ген выключен. Молочный сахар отсутствует и не подавляет репрессор, так что репрессор связывается с оператором, что препятствует связыванию РНК-полимеразы с промотором и началу производства фермента лактазы.
Низ: Ген включен. Лактоза подавляет репрессор, позволяя РНК-полимеразе связаться с промотором и начать экспрессию гена, который синтезирует фермент лактазу. Когда производимая геном лактаза переработает всю лактозу, не останется ничего чтобы связывать репрессор. Теперь репрессор вновь свяжется с оператором, приостанавливая производство лактазы.

Промотор в генетике — последовательность нуклеотидов ДНК, узнаваемая РНК-полимеразой как стартовая площадка для начала транскрипции. Промотор играет одну из ключевых ролей в процессе инициации транскрипции.

Обычно промотор расположен вокруг (±50 нуклеотидов) точки старта транскрипции – первого нуклеотида, с которого получается транскрипт, который имеет координату +1 (предыдущий нуклеотид -1). Промотор обычно включает ряд мотивов, важных для узнавания его РНК-полимеразой. В частности, -10 и -35 элементы у бактерий, ТАТА-бокс у эукариот.

Промотор асимметричен, что позволяет РНК-полимеразе начать транскрипцию в правильном направлении и указывает на то, какая из двух цепей ДНК будет служить матрицей для синтеза РНК. Матричная цепь ДНК называется некодирующей, при этом другая, кодирующая цепь совпадает с полученной РНК по последовательности (исключая замену тимина на урацил).

То, под каким промотором находится кодирующий РНК участок ДНК, играет решающую роль в интенсивности экспрессии этого гена в каждом конкретном типе клеток. По активности промоторы делят на конститутивные (постоянная экспрессия генов) и индуцибельные (транскрипция зависит от условий в клетке, например от присутствии определенных веществ или наличия теплового шока). Активация промотора определяется присутствием в разных клетках зависит от множества причин – присутствия набора транскрипционных факторов, репрессоров, различных взаимодействий.

Устройство промоторов[править | править код]

У бактерий[править | править код]

Коровая РНК-полимераза бактерий (состоящая из субъединиц α2ββ'ω) может инициировать транскрипцию в любом месте генома. Однако, в клетке инициации происходит только в участках промоторов. Такая специфичность обеспечивается σ-субъединицей, которая в комплексе с коровым ферментом образует голоэнзим. Основным σ-фактором клеток Escherichia coli является σ70-субъединица [1].

Классический (σ70) промотор [1][править | править код]

Характерной чертой промоторов, распознаваемых полимеразой с σ70-субъединицей, являются две консервативные последовательности длиной по 6 нуклеотидов, расположенные выше сайта начала транскрипции на 10 и 35 п.о., разделенные 17 нуклеотидами. Эти элементы называются соответственно -10 и -35 регионы (элементы). Эти регионы не идентичны во всех промоторах, но для них можно получить консенсусные последовательности.

Некоторые сильные промоторы также имеют UP-регион, расположенный выше -35-региона, который повышает связывание РНК-полимеразы. Некоторые σ70 промоторы не имеют -35-региона, зато имеют -10-регион, расширенный вверх на несколько нуклеотидов. Таков промотор галактозного оперона E.coli. Иногда ниже -10-элемента располагается ещё один связывающий элемент – дискриминатор.

Альтернативные промоторы [1][править | править код]

Альтернативные σ-субъединицы РНК-полимеразы меняют специфичность узнавания промоторов. Например, σ32-субъединица вызывает узнавание промоторов генов ответа на тепловой шок, σ54 связана с генами метаболизма азота.

У эукариот[править | править код]

Клетки эукариот содержат несколько типов РНК-полимераз. Транскрипцией мРНК занимается РНК-полимераза II вместе с набором белковых факторов транскрипции.

Промотор РНК-полимеразы II [1][править | править код]

Коровый промотор эукариот – это минимальный набор элементов последовательности, необходимый для связывания РНК-полимеразы II и транскрипционных факторов, необходимых для старта инициации транскрипции. Обычно длина корового промотора составляет 40-60 п.о., а располагаться он может или выше, или ниже точки старта транскрипции. Полный набор элементов корового промотора включает в себя BRE-элемент, ТАТА-бокс, Inr (инициатор) и/или нижележащие элементы (DPE, DCE и MTE). Обычно, в промоторе находится комбинация из этих элементов. Например, в одном промоторе обычно не встречаются DPE и TATA-бокс одновременно. Часто встречается комбинация TATA-бокса, DPE и Inr.

Элемент промотора Связываемый белок Координаты Консенсусная последовательность
BRE-элемент TFIIB -37 -32 [GC][GC][GA]CGCCC
ТАТА-бокс TBP -31 -26 TATA[AT]A[AT]
Inr TFIID -2 +4 [CT][CT]AN[TA][CT][CT]
DCEI TFIID +6 +11 CTTC
DCEII TFIID +16 +21 CTGT
MTE +21 +28
DPE TFIID +28 +32 [AG]G[AT]CGTG
DCEIII TFIID +30 +34 AGC

Также для протекания транскрипции эукариот необходимо взаимодействие с регуляторными последовательностями, расположенными дальше от промотора – проксимальными последовательностями, энхансерами, сайленсерами, инсуляторами, пограничными элементами.

Промотор РНК-полимеразы I [1][править | править код]

РНК-полимераза I в клетках эукариот транскрибирует единственный ген-предшественник рРНК, присутствующий в геноме во многих копиях.

Промотор гена рРНК содержит коровые элементы (координаты около -45 +20) и UCE (upstream control element, координаты около -150 -100). Инициация транскрипции этого гена также требует несколько факторов транскрипции – TBP, SL1 (состоит из белков TBP и трех TAF) и UBF. UBF связывает UCE-элемент, SF1 – коровый промотор. Связанный UBF стимулирует связывание полимеразы с участком корового промотора.

Промотор РНК-полимеразы III [1][править | править код]

РНК-полимераза III задействована в транскрипции генов некоторых некодирующих РНК клетки (тРНК, 5sРНК).

Промоторы РНК-полимеразы III очень разнообразны и обычно лежат ниже точки старта транскрипции. Промоторы генов тРНК, в частности, содержат A- и B-боксы, для инициации требуются факторы транскрипции TFIIIB и TFIIIC. Другие промоторы могут содержать A- и C-боксы (например 5sРНК), для инициации требуются факторы транскрипции TFIIIA, TFIIIB, TFIIIC. Группа промоторов РНК-полимеразы III содержит ТАТА-боксы.

Регуляция промоторов[править | править код]

Регуляция уровня транскрипции часто происходит на стадии инициации, то есть от связывания РНК-полимеразы с промотором до начала элонгации.

  • Связывание РНК-полимеразы с промотором может блокироваться белком-репрессором, физически закрывающим промотор или его участок.
  • Полимераза может нуждаться в дополнительном белке-активаторе для успешного связывания.
  • Участок хроматина с промотором может быть недоступен для белков, в том числе полимеразы, при компактной упаковке, например, гетерохроматин у эукариот.

Промоторный участок в пределах оперона у бактерий может частично перекрываться или вовсе не перекрываться с операторным участком цистрона (гена). У бактерий связывание с промотором определяется структурной частью полимеразы – σ-субъединицей. Также часто в регуляции участвуют белки-регуляторы, которые могут ускорять процесс и повышать его эффективность (активаторы), либо замедлять (репрессоры).

Транскрипция эукариот регулируется схожим с бактериями образом (за счет различных белков-регуляторов), но также имеет отличия. Гены эукариот не образуют оперонов, каждый ген обладает своим промотором. Эукариоты обладают хроматином, состоящим из ДНК и нуклеосом. И ДНК, и нуклеосомы могут подвергаться химической модификации, которая влияет на уровень транскрипции. Также, в регуляции промоторов у эукариот участвуют другие участки ДНК, такие как энхансеры, сайленсеры, инсуляторы, граничные элементы.

Примеры промоторов[править | править код]

Последовательности и особенности регуляции многих промоторов из разных живых организмов сейчас хороши изучены.

Эти знания широко применяются при создании биоинженерных генетических конструкций (плазмид, векторов). Для экспрессии продукта в клетках бактерий или эукариот может быть использован как промотор, характерный для этой группы организмов, найденный в геноме, так и промотор, например, из вирусов, которые заражают данный организм.

Бактерии[править | править код]

Классическими примерами бактериальных оперонов с известной регуляцией промоторов прокариот являются:

Фаги[править | править код]

  • Промотор фага T5
  • Промотор фага T7

Эукариоты[править | править код]

  • GAL1 промотор (дрожжи)
  • Индуцибельный тетрациклиновый промотор TRE
  • Индуцибельный экдизоновый промотор

Эукариотические вирусы[править | править код]

  • Конститутивные промоторы SV40 (вирус полимоы), RSV, CMV (цитомегаловирус)

Предсказание промоторного региона[править | править код]

Зачастую алгоритмы предсказания промоторов выдают большое количество ложноположительных результатов (предсказывают последовательности промоторов, которые таковыми не являются). Например, в среднем, различные алгоритмы предсказывают один промотор на 1000 п.о., в то время как человеческий геном содержит примерно один ген на 30000-40000 п.о. [2] Такой результат связан с тем, что при предсказании промоторов необходимо учитывать множество факторов [2]:

  • Разнообразное устройство промоторов
  • Связывание промоторов с регуляторными элементами (проксимальные элементы, энхансеры, сайленсеры) генома
  • Влияние CpG островов у эукариот (неметилированные CpG острова зачастую располагаются немного выше сайта старта транскрипции у эукариот)
  • Влияние инсуляторов и граничных условий (границы доменов хромосом)
  • Укладка ДНК и расположение нуклеосом в пространстве

Несмотря на сложности описанные выше, существует множество алгоритмов предсказания промоторных регионов в различных организмах. В таблице ниже приведены некоторые из них.

Название алгоритма Принцип работы алгоритма Что предсказывает алгоритм
TSSW [3] Алгоритм предсказывает потенциальные сайты начала транскрипции с помощью линейной дискриминантной функции, объединяющей характеристики, описывающие функциональные мотивы и олигонуклеотидный состав этих сайтов. TSSW использует базу данных функциональных сайтов TRANSFAC (автор базы данных – E. Wingender [4], отсюда последняя буква в названии метода TSSW). PolII промоторный регион человека.
TSSG [3]/Fprom [3] Алгоритм TSSG работает так же, как и TSSW, однако использует другую базу данных, TFD [5]. Fprom – тот же TSSG, натренированный на другом наборе последовательностей промоторов. TSSG – PolII промоторный регион человека, Fprom – промоторный регион человека.
TSSP [3] Алгоритм работает так же, как и TSSW, использует базу данных регуляторных элементов растений RegSite [6]. При этом алгоритм натренирован на последовательностях промоторных регионов растений. Промоторный регион растений.
PePPER [7] Алгоритм предсказывает промоторный регион основываясь на курируемых позиционной весовой матрице и скрытой марковской модели для -35 и -10 консенсусных последовательностей, а также различных сайтов связывания Bacillus subtilis и Escherichia coli (взяты как представители грамположительных и грамотрицательных бактерий соответственно). Промоторный регион прокариот (подходит в основном для бактериальных геномов).
PromoterInspector [8] Эвристический алгоритм основывается на геномном окружении промоторной области выборки последовательностей млекопитающих. PolII промоторный регион мелкопитающих.
BPROM [3] Алгоритм работает так же, как и TSSW, использует базу данных функциональных сайтов DPInteract [9]. σ70 промоторный регион E.coli.
NNPP 2.2 [10] Программа представляет собой нейронную сеть с запаздыванием, которая состоит из двух функциональных слоев, один – для распознавания TATA-бокса и один – для распознавания Inr-элемента. Промоторный регион эукариот и прокариот.
G4PromFinder [11] Алгоритм идентифицирует предполагаемые промоторы на основе AT-богатых элементов и G-квадруплексных ДНК-мотивов в GC-богатом регионе. Промоторный регион бактерий.

С ростом количества предсказанных, экспериментально показанных промоторных регионов различных организмов возникла необходимость создания базы данных промоторных последовательностей. Крупнейшей базой данных эукариотических последовательностей промоторов (в основном позвоночные организмы) является Eukaryotic Promoter Database [12]. База данных подразделяется на две части. Первая (EPD) – это курируемая коллекция последовательностей промоторов, полученная при помощи обработки экспериментальных данных, вторая (EPDnew) – результат слияния информации о промоторах из базы данных EPD с анализом данных методов высокопроизводительного секвенирования. При помощи высокопроизводительных методов получения транскриптомов, удалось получить набор промоторов для некоторых представителей растений и грибов [13]:


См. также[править | править код]


Примечания[править | править код]

  1. 1 2 3 4 5 6 Watson JD, Baker TA, Bell SP, Gann AA, Levine M, Losick RM. Molecular Biology of the Gene. — 7th. — Pearson, 2014.
  2. 1 2 Pedersen A Gorm, Brunak S, Baldi P, Chauvin Y (1999). “The biology of eukaryotic promoter prediction - a review”. Comput Chem. 23 (3–4): 191–207. DOI:10.1016/S0097-8485(99)00015-7.
  3. 1 2 3 4 5 Solovyev VV, Shahmuradov IA, Salamov AA (2010). “Identification of promoter regions and regulatory sites”. Methods Mol Biol. 674: 57–83. DOI:10.1007/978-1-60761-854-6_5.
  4. Wingender E, Dietze P, Karas H, Knuppel R (1996). “TRANSFAC: a database on transcription factors and their DNA binding sites”. Nucleic Acids Res. 24 (1): 238–241. DOI:10.1093/nar/24.1.238.
  5. Ghosh D (1990). “A relational database of transcription factors”. Nucleic Acids Res. 18 (7): 1749–1756. DOI:10.1093/nar/18.7.1749.
  6. RegSite Database. SoftBerry. Дата обращения 7 апреля 2019.
  7. de Jong A, Pietersma H, Cordes M, Kuipers OP, Kok J (2012). “PePPER: a webserver for prediction of prokaryote promoter elements and regulons”. BMC Genomics. 13 (1): 299. DOI:10.1186/1471-2164-13-299.
  8. Scherf M, Klingenhoff A, Werner T (2000). “Highly specific localization of promoter regions in large genomic sequences by PromoterInspector: a novel context analysis approach”. J Mol Biol. 297 (3): 599–606. DOI:10.1006/jmbi.2000.3589.
  9. Robinson K, McGuire AM, Church GM (1998). “A comprehensive library of DNA-binding site matrices for 55 proteins applied to the complete Escherichia coli K-12 genome”. J Mol Biol. 284 (2): 241–254. DOI:10.1006/jmbi.1998.2160.
  10. Burden S, LinYX, Zhang R (2005). “Improving promoter prediction for the NNPP2.2 algorithm: a case study using Escherichia coli DNA sequences”. Bioinformatics. 21 (5): 601–607. DOI:10.1093/bioinformatics/bti047.
  11. di Salvo M, Pinatel E, Tala A, Fondi M, Peano C, Alifano P (2018). “G4PromFinder: an algorithm for predicting transcription promoters in GC-rich bacterial genomes based on AT-rich elements and G-quadruplex motifs”. BMC Bioinformatics. 19 (1): 36. DOI:10.1186/s12859-018-2049-x.
  12. Cavin Perier R, Junier T, Bucher P (1998). “The eukaryotic promoter database EPD”. Nucleic Acids Res. 26 (1): 353–357. DOI:10.1093/nar/26.1.353.
  13. Dreos R, Ambrosini G, Groux R, Cavin Perier R, Bucher P (2017). “The eukaryotic promoter database in its 30th year: focus on non-vertebrate organisms”. Nucleic Acids Res. 45 (D1): D51–D55. DOI:10.1093/nar/gkw1069.

Литература[править | править код]