Кэп-анализ экспрессии генов: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Добавлен раздел "Основанные на принципах CAGE протоколы"
Строка 111: Строка 111:
* лигирование со 2-м линкером, комплеметарным 3'-концевым праймерам секвенирования,
* лигирование со 2-м линкером, комплеметарным 3'-концевым праймерам секвенирования,
* ПЦР (необходимый этап при создании библиотеки клонов и дальнейшего секвенирования) содержат 5'- и 3'-концевые последовательности праймеров секвенирования
* ПЦР (необходимый этап при создании библиотеки клонов и дальнейшего секвенирования) содержат 5'- и 3'-концевые последовательности праймеров секвенирования

==Основанные на принципах ''CAGE'' протоколы==
===''DeepCAGE''<ref name="Valen-2009">{{cite journal
|last1= Valen
|first1= Eivind
|year= 2009
|title= Genome-wide detection and analysis of hippocampus core promoters using DeepCAGE.
|journal= Genome Res.
|volume= 19
|issue= 2
|pages= 255–265
|doi= 10.1101/gr.084541.108
|pmid= 19074369
|url= http://genome.cshlp.org/content/19/2/255
|accessdate= 2013-10-16
}}</ref>===
В ''DeepCAGE'' (Valen ''et al.'', 2008) для прочтения конкатемеров (см. базовый протокол) впервые были применены методы [[454 Life Sciences|454]] секвенирования “''нового поколения (NGS)''”.
* метод устарел по сравнению с более поздними протоколами.

===''nanoCAGE''<ref name="Plessy-2010">{{cite journal
|last1= Plessy
|first1= Charles
|year= 2010
|title= Genome-wide detection and analysis of hippocampus core promoters using DeepCAGE.
|journal= Nat Methods.
|volume= 7
|issue= 7
|pages= 528–34
|doi= 10.1038/nmeth.1470
|pmid= 20543846
|url= http://www.nature.com/nmeth/journal/v7/n7/full/nmeth.1470.html
|accessdate= 2013-10-16
}}</ref>===
В ''nanoCAGE'' (Plessy ''et al.'', 2010) вместо использования реагента "CAP Trapper" был применен подход со сменой матрицы для анализа меньших количеств РНК в образце. Также впервые удалось увеличить длину последовательностей до 27 нуклеотидов за счет использования эндонуклеазы EcoP15I и отказаться от образования конкатемеров, читая последовательности напрямую на NGS-платформе {{iw|Solexa|||DNA sequencing#Illumina (Solexa) sequencing}} (сейчас часть [[Illumina|Illumina]]).

===''CAGEscan''<ref name="Plessy-2010"/>===
В ''CAGEscan'' (Plessy ''et al.'', 2010) те же авторы предлагают методику, где:
* Не используется стадия ферментативного отрезания 5'-тегов.
* 5'-концы кДНК секвенируются в обе стороны, чтобы соединить данные о новых промоторах со старыми аннотациями.

===''HeliScopeCAGE''<ref name="Kanamori-Katayama-2011">{{cite journal
|last1= Kanamori-Katayama
|first1= Mutsumi
|year= 2011
|title= Unamplified cap analysis of gene expression on a single-molecule sequencer.
|journal= Genome Res.
|volume= 21
|issue= 7
|pages= 1150–9
|doi= 10.1101/gr.115469.110
|pmid= 21596820
|url= http://genome.cshlp.org/content/21/7/1150.long
|accessdate= 2013-10-16
}}</ref>===
В ''HeliScopeCAGE'' (Kanamori-Katayama ''et al.'', 2011) базовый протокол модифицируется, чтобы пропустить стадию разрезания 5'-концевых участков, 5'-кэпированные РНК секвенируются без ПЦР с использованием платформы {{iw|HeliScope|||Helicos single molecule fluorescent sequencing}} (секвенирует индивидуальные молекулы). Протокол автоматизирован Itoh ''et al.''<ref name="Itoh-2012">{{cite journal
|last1= Itoh
|first1= Masayoshi
|year= 2012
|title= Automated workflow for preparation of cDNA for cap analysis of gene expression on a single molecule sequencer.
|journal= PLoS ONE
|volume= 7
|issue= 1
|pages= e30809
|doi= 10.1371/journal.pone.0030809
|pmid= 22303458
|url= http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0030809
|accessdate= 2013-10-16
}}</ref> в 2012 году.

===Усовершенствованный CAGE протокол<ref name="pmid22362160" />===
См. раздел "'''Развитие технологии'''".
* За счет EcoP15I увеличена точность картирования последовательностей
* секвенирование на платформе Illumina-Solexa

===''RAMPAGE''<ref name="Batut-2013">{{cite journal
|last1= Batut
|first1= Philippe
|year= 2013
|title= High-fidelity promoter profiling reveals widespread alternative promoter usage and transposon-driven developmental gene expression.
|journal= Genome Res.
|volume= 23
|issue= 1
|pages= 169–80
|doi= 10.1101/gr.139618.112
|pmid= 22936248
|url= http://genome.cshlp.org/content/23/1/169.long
|accessdate= 2013-10-16
}}</ref>===
В 2013, Batut ''et al.'' совместили использование исходного реагента "CAP Тrapper", смену матрицы (''nanoCAGE'') и обработку 5′-фосфат-зависимыми экзонуклеазами для максимизации специфичности промотора.

===''nAnTi-CAGE''<ref name="Murata-2014">{{cite journal
|last1=Murata
|first1=Mitsuyoshi
|year=2014
|title=Detecting Expressed Genes Using CAGE
|journal=Methods Mol Biol.
|volume=1164
|pages=67–85
|doi=10.1007/978-1-4939-0805-9_7
|pmid=24927836
|url=http://link.springer.com/protocol/10.1007%2F978-1-4939-0805-9_7
|accessdate=2014-08-13
}}</ref>===
В 2014, Murata ''et al.''создали протокол для Illumina, не использующий ни ПЦР, ни разрезание 5'-концевых целевых последовательностей.


== Анализ ==
== Анализ ==

Версия от 12:14, 2 мая 2015

Кэп-анализ экспрессии генов (англ. CAGE, cap analysis gene expression) — это технология, используемая в молекулярной биологии для получения и прочтения коротких (обычно длиной 27 нуклеотидов) участков последовательности 5’-конца кэпированных РНК эукариот. Проводится картирование секвенированных последовательностей на готовый геном, что позволяет уточнить 5'-границы транскрибируемых областей, а также провести количественный анализ экспрессии. Методика была разработана и опубликована в 2003 году, после чего активно совершенствовалась.[1] Метод активно используется в исследовательском проекте по функциональной аннотации геномов млекопитающих (англ. FANTOM — Functional Annotation of the Mammalian Genome)[2]

Актуальность метода

Биологический аспект

Сайт старта транскрипции прокариот определяется с высокой точностью. У бактерий транскрипция инициируется связыванием РНК-полимеразы с промотором на -10 и -35 нуклеотидов до точки начала транскрипции.[3] Для транскрипции архей и эукариот необходима преинициация с участием транскрипционных факторов. У эукариот области связывания транскрипционных факторов расположены на -30, -70 и -90 нуклеотидов выше от старта транскрипции и задают базовый уровень транскрипции, кроме того существует множество активаторов и репрессоров транскрипции, которые участвуют в регуляции ее скорости. [4] Сложность системы инициации транскрипции у эукариот затрудняет точное предсказание сайта начала транскрипции.

Внешние изображения
Поддержка ридами участков секвенируемой РНК при RNA-seq не одинакова
Рис. 1. Зависимость количества ридов от их положения на РНК при различных методиках RNA-seq

С другой стороны используемый для поиска транскрибируемых участков RNA-seq основан на современных методах секвенирования с картированием ридов на геном. При этом возникают отклонения в количестве ридов на концах транскрибируемой области (см. Рис. 1.), и четкой границы с точностью до одного нуклеотида на обоих концах РНК определить обычно не удается. Именно для борьбы с проблемой определения точки начала транскрипции у эукариот борется метод CAGE и различные его модификации.


Технологические тонкости

Сравнение методов RNA-seq и CAGE показывает, что оба метода дают почти одинаковые количественные оценки экспрессии генов[5]. Это подтверждает высокую эффективность метода CAGE еще и для количественного анализа экспрессии.

Базовый протокол эксперимента[1][6]

Внешние изображения
Иллюстрация эксперимента
Рис. 2. Схема предложенного разработчиками протокола [1]
  1. Синтез полной кДНК обратной транскриптазой с олиго-Т праймером, комплементарным полиаденилированному 3’-концу мРНК. Получение полных мРНК-кДНК гибридов.
  2. Гидролиз мРНК, получение одноцепочечной полной кДНК.
  3. Прикрепление 1-го биотинилированного линкера со стороны, соответствующей кэпу, включающего в себя сайт узнавания эндонуклеазы рестрикции XmaJI и сайт узнавания рестриктазы класса II MmeI. В методе используется реагент "CAP Trapper"[7], специфично взаимодействующий с двумя гидроксильными группами КЭПа.
  4. Лигирование 1-го линкера с одноцепочечной кДНК и синтез второй цепи кДНК (до сайта полиаденилирования).
  5. Обработка эндонулеазой рестрикции MmeI. Рестриктаза MmeI способна делать разрез двухцепочечной нуклеиновой кислоты, отступив 20/18 нуклеотидов. Эта ее особенность используется, чтобы избавиться от большей части кДНК, сохранив примерно 20 нуклеотидов, соответствующих 5'-концу мРНК.
  6. Лигирование с противоположной стороны 2-го биотинилированного линкера, содержащего сайт узнавания XbaI.
  7. Полимеразная цепная реакция (увеличение числа копий).
  8. Обработка рестриктазами XmaJI и XbaI (получение фрагментов по 32 нуклеотида, из которых 20 — последовательность с 5'-конца мРНК).
  9. Очистка стрептавидином (избавляемся от фрагментов линкеров).
  10. Получение конкатемеров лигированием липких GATC концов, возникших после обработки рестриктазами.
  11. Создание библиотеки клонов и секвенирование по Сэнгеру.
  12. Картирование фрагментов на собранный геном.

Развитие технологии

Внешние изображения
Схема обновленного эксперимента
Рис. 3. Схема нового протокола CAGE[8]

В 2011 году, в связи с задействованием технологии в ENCODE, был переосмыслен протокол CAGE для секвенирования платформами нового поколения[8]. Так, теперь:

  • в реакции обратной транскрипции используется фермент, не имеющий рибонуклеазной активности,

— обратная транскриптаза SuperScript II (Rnase Н — активность практически уничтожена мутагенезом)[9] заменена на PrimeScript (отсутствует активность Rnase Н, кроме того хорошо работает с GC-богатой РНК и РНК с богатой вторичной структурой, обладает более высокой точностью)[10].

  • вместо олиго-Т праймера теперь используются праймеры, содержащие случайную последовательность длиной 15 нт и сайт эндонуклеазы EcoP15I,

— случайные праймеры были впервые предложены в 2006 году [11] и позволяют работать с слабополиаденилированной и неполиаденилированной РНК.

  • перед биотинилированием смесь обрабатывается рибонуклеазами,

— увеличивает качество очистки целевой РНК

  • биотинилируются как кэп, так и 3'-конец, которые разделяют вместе с полученными кДНК в результате нагревания до 65°С,
  • стрептавидином экстрагирются димеры кДНК и РНК с биотинил-кэпом,

— благодаря обработке РНКазами не экстрагируются неполные с 5'-конца РНК

  • одноцепочечные кДНК лигируют со специально подготовленными димерами маркированных линкеров, неспособными соединяться друг с другом,
  • после лигирования кДНК с димерами линкеров смесь обрабатывают специальной фосфатазой, работающей при низких температурах,

— увеличивает точность метода

  • синтеза второй цепи кДНК при участии биотинил-праймеров,
  • Обработка эндонуклеазой EcoP15I и очистка целевых последовательностей стрептавидином,

— эндонуклеаза EcoP15I впервые была использована в nanoCAGE (Plessy et al., 2010),[12] и позволяет увеличить читаемое число нуклеотидов с 20 до 27, увеличив таким образом однозначность картирования последовательностей на геном.

  • лигирование со 2-м линкером, комплеметарным 3'-концевым праймерам секвенирования,
  • ПЦР (необходимый этап при создании библиотеки клонов и дальнейшего секвенирования) содержат 5'- и 3'-концевые последовательности праймеров секвенирования

Основанные на принципах CAGE протоколы

DeepCAGE[13]

В DeepCAGE (Valen et al., 2008) для прочтения конкатемеров (см. базовый протокол) впервые были применены методы 454 секвенирования “нового поколения (NGS)”.

  • метод устарел по сравнению с более поздними протоколами.

nanoCAGE[12]

В nanoCAGE (Plessy et al., 2010) вместо использования реагента "CAP Trapper" был применен подход со сменой матрицы для анализа меньших количеств РНК в образце. Также впервые удалось увеличить длину последовательностей до 27 нуклеотидов за счет использования эндонуклеазы EcoP15I и отказаться от образования конкатемеров, читая последовательности напрямую на NGS-платформе Solexa[англ.] (сейчас часть Illumina).

CAGEscan[12]

В CAGEscan (Plessy et al., 2010) те же авторы предлагают методику, где:

  • Не используется стадия ферментативного отрезания 5'-тегов.
  • 5'-концы кДНК секвенируются в обе стороны, чтобы соединить данные о новых промоторах со старыми аннотациями.

HeliScopeCAGE[14]

В HeliScopeCAGE (Kanamori-Katayama et al., 2011) базовый протокол модифицируется, чтобы пропустить стадию разрезания 5'-концевых участков, 5'-кэпированные РНК секвенируются без ПЦР с использованием платформы HeliScope[англ.] (секвенирует индивидуальные молекулы). Протокол автоматизирован Itoh et al.[15] в 2012 году.

Усовершенствованный CAGE протокол[8]

См. раздел "Развитие технологии".

  • За счет EcoP15I увеличена точность картирования последовательностей
  • секвенирование на платформе Illumina-Solexa

RAMPAGE[16]

В 2013, Batut et al. совместили использование исходного реагента "CAP Тrapper", смену матрицы (nanoCAGE) и обработку 5′-фосфат-зависимыми экзонуклеазами для максимизации специфичности промотора.

nAnTi-CAGE[17]

В 2014, Murata et al.создали протокол для Illumina, не использующий ни ПЦР, ни разрезание 5'-концевых целевых последовательностей.

Анализ

Результатом кэп-анализа экспрессии генов является набор последовательностей секвенированных областей, следующих за сайтами старта транскрипции, и их уровень экспрессии. Граница начала транскрипции определяется с точностью до одного нуклеотида. Данные области, как правило, включают в себя значительную часть элементов, которые регулируют уровень экспрессии генов. Таким образом, различия в частоте встречаемости может коррелировать с наличием либо отсутствием факторов регуляции (транскрипционные факторы, репрессоры и пр.). Благодаря данному методу стало доступным картировать сайты стартов транскрипции и промоторы для мРНК с низким уровнем экспрессии.[18]

Примечания

  1. 1 2 3 "Cap analysis gene expression for high-throughput analysis of transcriptional starting point and identification of promoter usage". Proc Natl Acad Sci USA. 100(26): 15776–81. 2003-12-23. doi:10.1073/pnas.2136655100. PMC 307644. PMID 14663149.
  2. The Catalytic Site Atlas at The European Bioinformatics Institute
  3. Raven, Peter H. Biology. — 9th. — New York : McGraw-Hill, 2011. — P. 278–301. — ISBN 978-0-07-353222-6.
  4. Basic Medical Biochemistry, 4th edition, Marks. Chapter 14
  5. "Comparison of CAGE and RNA-seq transcriptome profiling using clonally amplified and single-molecule next-generation sequencing". Genome Res. 2014 Apr;24(4):708-17. doi: 10.1101/gr.156232.113. PMID 24676093.
  6. "CAGE: cap analysis of gene expression". Nature Methods 3, 211 - 222 (2006) doi:10.1038/nmeth0306-211
  7. Carninci, Piero (1996). "High-efficiency full-length cDNA cloning by biotinylated CAP trapper". Genomics. 37 (3): 327—36. doi:10.1006/geno.1996.0567. PMID 8938445. Дата обращения: 16 октября 2013.
  8. 1 2 3 Hazuki Takahashi, Timo Lassmann, Mitsuyoshi Murata & Piero Carninci. 5′ end–centered expression profiling using cap-analysis gene expression and next-generation sequencing // Nature Protocols. — 2012. — Vol. 7, № 3. — С. 542-561. — doi:10.1038/nprot.2012.005.
  9. SuperScript II
  10. PrimeScript
  11. Kodzius, Rimantas (2006). "CAGE: cap analysis of gene expression". Nat Methods. 3 (3): 211—22. doi:10.1038/nmeth0306-211. PMID 16489339. Дата обращения: 16 октября 2013.
  12. 1 2 3 Plessy, Charles (2010). "Genome-wide detection and analysis of hippocampus core promoters using DeepCAGE". Nat Methods. 7 (7): 528—34. doi:10.1038/nmeth.1470. PMID 20543846. Дата обращения: 16 октября 2013.
  13. Valen, Eivind (2009). "Genome-wide detection and analysis of hippocampus core promoters using DeepCAGE". Genome Res. 19 (2): 255—265. doi:10.1101/gr.084541.108. PMID 19074369. Дата обращения: 16 октября 2013.
  14. Kanamori-Katayama, Mutsumi (2011). "Unamplified cap analysis of gene expression on a single-molecule sequencer". Genome Res. 21 (7): 1150—9. doi:10.1101/gr.115469.110. PMID 21596820. Дата обращения: 16 октября 2013.
  15. Itoh, Masayoshi (2012). "Automated workflow for preparation of cDNA for cap analysis of gene expression on a single molecule sequencer". PLoS ONE. 7 (1): e30809. doi:10.1371/journal.pone.0030809. PMID 22303458. Дата обращения: 16 октября 2013.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  16. Batut, Philippe (2013). "High-fidelity promoter profiling reveals widespread alternative promoter usage and transposon-driven developmental gene expression". Genome Res. 23 (1): 169—80. doi:10.1101/gr.139618.112. PMID 22936248. Дата обращения: 16 октября 2013.
  17. Murata, Mitsuyoshi (2014). "Detecting Expressed Genes Using CAGE". Methods Mol Biol. 1164: 67—85. doi:10.1007/978-1-4939-0805-9_7. PMID 24927836. Дата обращения: 13 августа 2014.
  18. "Deep cap analysis gene expression (CAGE): genome-wide identification of promoters, quantification of their expression, and network inference". BioTechniques 44:627-632 (25th Anniversary Issue, April 2008) doi 10.2144/000112802

Ссылки

CAGE — страница на сайте научно-исследовательского центра RIKEN