Секвенирование РНК

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Секвенирование РНК — определение первичной структуры молекулы РНК. Под этим может подразумеваться как секвенирование мРНК, так и определение последовательности некодирующих РНК. Современное полногеномное секвенирование РНК (RNA-seq) основано на прямом секвенировании фрагментов кДНК[1].

История[править | править вики-текст]

Технологическая платформа для быстрого широкомасштабного секвенирования была создана в 2005 году фирмами 454 Life Sciences[2] и Illumina (ранее Solexa)[3] и сначала использовалась для секвенирования геномов. Первые работы по секвенированию транскриптомов появились в 2008 году. В числе первых, были секвенированы транскриптом дрожжей[4], арабидопсиса[5] и мыши[6].

В настоящее время РНК-секвенирование осуществляется в основном с использованием трех инструментальных платформ широкомасштабного секвенирования: Illumina, 454 Life Sciences и SOLiD[7].

В отличие от другого широкомасштабного метода анализа транскриптома — экспрессионных микрочипов, РНК-секвенирование позволяет получать данные о сплайс-вариантах транскриптов, редактировании, однонуклеотидных полиморфизмах, а также химерных генах. Кроме того, РНК-секвенирование позволяет получить абсолютную количественную информацию о представленности различных транскриптов в пробе, в отличие от относительных количественных данных микрочипов[8][9].

Методы[править | править вики-текст]

Библиотека «поли-А» РНК[править | править вики-текст]

Процесс создания библиотеки сиквенсов может меняться в зависимости от платформы при высокопроизводительном секвенировании,[10] для каждой платформы было разработано несколько типов комплектов для создания различных типов библиотек РНК, адаптирующие полученные последовательности специфическим требованиям их технологий. Однако в связи с природой анализируемого образца, в рамках каждой технологии есть общие черты. Часто, при анализе мРНК целью какого-либо воздействия становится поли-А хвост для того, чтобы удостовериться в разделении кодирующей и некодирующей РНК. Это может быть достигнуто простым отжиганием олиго-Т праймера с этой областью. Сейчас с этой целью часто пользуются магнитными бусами.[11][12] Вебсайт «The Protocol Online»[13] предоставляет список нескольких протоколов, относящихся к выделению мРНК.

Исследования, в которых изучались в том числе участки транскриптома помимо поли-а РНК, показали, что при использовании магнитных бус с поли-Т праймерами, проточной (не содержащей поли-А) РНК можно обнаружить гены некодирующей РНК, которые в противном случае остались бы незамеченными.[11] Так как наибольшая часть тотальной РНК клетки приходится на рибосомальную РНК, для исследования транскриптома разработан метод селективного удаления рибосомальной фракции РНК с помощью зондовой гибридизации, после чего для секвенирования остаются матричные и некодирующие РНК.[14][15]

Далее производят обратную транскрипцию. При этом проблему могут представлять как разнородные 5' концы, возникающие при обратном транскрибировании с использованием случайных праймеров, так и вторичные структуры, влияющие на сайты связывания праймеров,[12] гидролиз РНК до 200—300 нуклеотидов помогает решить обе эти проблемы. Однако для этого метода существуют компромиссные решения, при которых основная часть транскрипта эффективно преобразуется в ДНК, а 5'- и 3'-концы в меньшей степени. В зависимости от цели эксперимента, исследователи могут провести или проигнорировать этот шаг.

После синтеза кДНК, ее можно фрагментировать для достижения желаемой длины фрагментов.

Далее проводится глубокое секвенирование кДНК с получением множества коротких прочитанных фрагментов («ридов»). Чем больше общее число ридов, тем точнее результаты секвенирования. На заключительном этапе проводится восстановление структуры транскриптов путем сопоставления полученного набора ридов с геном.[6]

Этапы секвенирования и обработки его результатов проводятся с использованием высокотехнологичного оборудования и сложного программного обеспечения.

Секвенирование малых и некодирующих РНК[править | править вики-текст]

При секвенировании РНК, отличной от мРНК, процедура создания библиотеки модифицируется. Клеточная РНК выбирается в соответствии с желаемым интервалом длин. Для коротких РНК, таких как миРНК, РНК выделяется путем отбора по длине. Это может быть достигнуто с помощью электрофореза, специальных магнитных бус или коммерчески разработанных комплектов. После выделения, на 3'- и 5'-концы добавляются линкеры и производится очистка. Далее получают кДНК путем обратной транскрипции.

Прямое секвенирование РНК[править | править вики-текст]

Так как обратная транскрипция РНК с помощью обратной транскриптазы дает большое число ошибок и артефактов, которые могут препятствовать корректному качественному и количественному анализу транскриптов,[16] компанией Helicos была начата разработка технологии мономолекулярного прямого секвенирования РНК (Direct RNA Sequencing, DRSTM). Этот метод предполагает секвенирование РНК массово-параллельным образом, без получения кДНК, лигирования, амплификации и других процедур, которые могут изменить образец.

Секвенирование поли А(-) РНК[править | править вики-текст]

Для секвенирования нематричных РНК, не содержащих поли А, применяют две стратегии: синтез кДНК с использованием гексамерных праймеров со случайной последовательностью или лигирование РНК-адаптеров с последующим синтезом кДНК с использованием праймера, комплиментарного адаптеру. После получения библиотеки кДНК процесс секвенирования такой же, как и в случае мРНК.

Проблемы[править | править вики-текст]

Основная проблема технологии RNA-seq заключается в том, что априори неизвестно, какому транскрипту соответствует прочитанный фрагмент. Особенно сложно решить данную проблему в случае исследования транскриптома высших эукариот с частым альтернативным сплайсингом и присутствием в геноме большого числа паралогов. Существует два подхода для восстановления транскриптов по прочитанным фрагментам: картирование на геном отдельных прочитанных фрагментов[17] или восстановление структуры транскрипта de novo с последующим картированием полноразмерного транскрипта на геном[18]

Применение[править | править вики-текст]

Определение уровня транскрипции[править | править вики-текст]

Метод секвенирования РНК становится основным методом определения того, какие гены и на каком уровне экспрессируются в клетке. С помощью РНК секвенирования можно определять различия в экспрессии генов на различных стадиях развития организма[19] или в разных тканях[20]. Например, разработан метод локализации in situ последовательностей РНК-транскриптов, с помощью флуоресцентного секвенирования (FISSEQ), который позволяет изучать фенотип клеток и регуляцию активности генов непосредственно в биологическом образце (на срезах тканей)[21][22][23]. Также можно определить транскрипция каких генов изменяется при развитии болезней и рака[24]. В связи с удешевлением методов секвенирования нового поколения появилась возможность определять экспрессию генов у любого человека для диагностики заболеваний.

Выявление однонуклеотидных полиморфизмов[править | править вики-текст]

РНК-секвенирование позволяет различить транскрипты с отличием в одном нуклеотиде, поэтому может быть использовано как для выявления экспрессируемых однонуклеотидных полиморфизмов в генах, так и для и изучения процесса редактирования РНК[25][26]

Определение мест альтернативного сплайсинга[править | править вики-текст]

Секвенирование РНК — наиболее удобный способ определения мест альтернативного сплайсинга, а также количественного соотношения различных альтернативных форм транскрипта[27][28]. Другие методы не позволяют картировать места альтернативного сплайсинга на всем протяжении генома.

Также как и определение экспрессии генов, определение соотношения альтернативных форм транскриптов можно проводить на различных стадиях развития организма или в разных тканях.

Поиск некодирующих РНК и малых РНК[править | править вики-текст]

РНК секвенирование применяется также и для обнаружения некодирующих РНК. При этом необходимо решить две важных проблемы: получить и амплифицировать кДНК на матрице некодирующей РНК, которая часто не содержит поли-А; кроме того, необходимо уменьшить количество рРНК в библиотеке. Последние составляют подавляющее количество клеточных некодирующих РНК и очень сильно снижают количество сигналов от других РНК.

РНК-секвенирование раковых транскриптомов[править | править вики-текст]

РНК-секвенирование широко используется в настоящее время для исследование особенностей транскриптома раковых клеток, в том числе появление химерных транскриптов[29] и раково-специфичных продуктов альтернативного сплайсинга[30].

Детекция гибридных генов[править | править вики-текст]

Гибридизация генов происходит из-за различных структурных модификаций в геноме и может быть связана с раком.[31] Возможность анализировать весь транскриптом образца с помощью секвенирования РНК, делает этот метод привлекательным для поиска подобных частых преобразований при раковой трансформации клеток.[32]

При картировании транскриптомных ридов на референсный геном, большая часть ридов попадает в область экзона, тогда как небольшая, но все еще значительная их фракция может быть выровнена с известными экзон-экзонными соединениями. Оставшаяся часть невыровненных ридов может быть проанализирована на наличие ридов, выравнивающихся с местами соединения экзонов из разных генов. В таком случае, это будет свидетельством гибридизации генов. Альтернативный вариант заключается в использовании ридов со спаренными концами. При этом у потенциально большой фракции ридов концы выравнятся с разными экзонами, что даст лучшее покрытие участков соединения экзонов из разных генов.

ENCODE и modENCODE[править | править вики-текст]

Секвенирование РНК является одним из основных методов исследований, проводимых в рамках проектов ENCODE и modENCODE, направленных на создание базы данных элементов генома человека[33] и основных модельных объектов молекулярной биологии[34][35].

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Haas BJ, Zody MC. Advancing RNA-Seq analysis. Nat Biotechnol. 2010 May;28(5):421-3. doi: 10.1038/nbt0510-421.
  2. Margulies M et al Genome sequencing in microfabricated high-density picolitre reactors. 2005 Sep 15;437(7057):376-80. Epub 2005 Jul 31.
  3. Simon T Bennett, Colin Barnes, Anthony Cox, Lisa Davies, and Clive Brown Toward the $1000 human genome. Pharmacogenomics, Jun 2005, Vol. 6, No. 4 , Pages 373—382
  4. Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M. The transcriptional landscape of the yeast genome defined by RNA sequencing. Science. 2008 Jun 6;320(5881):1344-9. doi: 10.1126/science.1158441. Epub 2008 May 1.
  5. Lister R, O’Malley RC, Tonti-Filippini J, Gregory BD, Berry CC, Millar AH, Ecker JR. Highly integrated single-base resolution maps of the epigenome in Arabidopsis. Cell. 2008 May 2;133(3):523-36. doi: 10.1016/j.cell.2008.03.029.
  6. 1 2 Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B. (2008). «Mapping and quantifying mammalian transcriptomes by RNA-seq». Nature Methods 5 (7): 621—628. doi:10.1038/nmeth.1226. PMID 18516045
  7. Metzker ML. Sequencing technologies — the next generation. Nat Rev Genet. 2010 Jan;11(1):31-46. doi: 10.1038/nrg2626. Epub 2009 Dec 8]
  8. Marioni JC, Mason CE, Mane SM, Stephens M, Gilad Y. (2008). «RNA-seq: An assessment of technical reproducibility and comparison with gene expression arrays». Genome Research 18 (9): 1509—1517. doi:10.1101/gr.079558.108. PMC 2527709. PMID 18550803.
  9. Nookaew I, Papini M, Pornputtapong N, Scalcinati G, Fagerberg L, Uhlén M, Nielsen J. «A comprehensive comparison of RNA-Seq-based transcriptome analysis from reads to differential gene expression and cross-comparison with microarrays: a case study in Saccharomyces cerevisiae». Nucleic Acids Res. 2012 Nov 1;40(20):10084-97. doi: 10.1093/nar/gks804. Epub 2012 Sep 10.
  10. Wang Z, Gerstein M, Snyder M. (January 2009). «RNA-Seq: a revolutionary tool for transcriptomics». Nature Reviews Genetics 10 (1): 57–63. DOI:10.1038/nrg2484. PMID 19015660.
  11. 1 2 Ryan D. Morin, Matthew Bainbridge, Anthony Fejes, Martin Hirst, Martin Krzywinski, Trevor J. Pugh, Helen McDonald, Richard Varhol, Steven J.M. Jones, and Marco A. Marra. (2008). «Profiling the HeLa S3 transcriptome using randomly primed cDNA and massively parallel short-read sequencing». BioTechniques 45 (1): 81–94. DOI:10.2144/000112900. PMID 18611170.
  12. 1 2 Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B. (2008). «Mapping and quantifying mammalian transcriptomes by RNA-seq». Nature Methods 5 (7): 621–628. DOI:10.1038/nmeth.1226. PMID 18516045.
  13. RNA Extraction/mRNA Isolation Protocols
  14. Liu W, Zhao Y, Cui P, Lin Q, Ding F, Xin C, Tan X, Song S, Yu J, Hu S. «Thousands of Novel Transcripts Identified in Mouse Cerebrum, Testis, and ES Cells Based on ribo-minus RNA Sequencing». Front Genet. 2011;2:93. doi: 10.3389/fgene.2011.00093. Epub 2011 Dec 26. PMID:22303387
  15. Cui P, Lin Q, Ding F, Xin C, Gong W, Zhang L, Geng J, Zhang B, Yu X, Yang J, Hu S, Yu J. «A comparison between ribo-minus RNA-sequencing and polyA-selected RNA-sequencing». Genomics. 2010 Nov;96(5):259-65. doi: 10.1016/j.ygeno.2010.07.010. Epub 2010 Aug 3.PMID: 20688152
  16. Liu D, Graber JH (2006). «Quantitative comparison of EST libraries requires compensation for systematic biases in cDNA generation». BMC Bioinformatics 7: 77. DOI:10.1186/1471-2105-7-77. PMID 16503995.
  17. Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter (2010). «Transcript assembly and abundance estimation from RNA-Seq reveals thousands of new transcripts and switching among isoforms». Nature Biotechnology 28 (5): 511—515. doi:10.1038/nbt.1621. PMC 3146043. PMID 20436464
  18. Birol I, Jackman SD, Nielsen CB, Qian JQ, Varhol R, Stazyk G, Morin RD, Zhao Y, Hirst M, Schein JE, Horsman DE, Connors JM, Gascoyne RD, Marra MA, Jones SJ.De novo transcriptome assembly with ABySS.Bioinformatics. 2009 Nov 1;25(21):2872-7.[1]
  19. Graveley BR, Brooks AN, Carlson JW et al The developmental transcriptome of Drosophila melanogaster. Nature. 2011 Mar 24;471(7339):473-9. doi: 10.1038/nature09715. Epub 2010 Dec 22.PMID:21179090
  20. Xie L, Weichel B, Ohm JE, Zhang K. An integrative analysis of DNA methylation and RNA-Seq data for human heart, kidney and liver.BMC Syst Biol. 2011 Dec 23;5 Suppl 3:S4. doi: 10.1186/1752-0509-5-S3-S4. Epub 2011 Dec 23. PMID: 22784623
  21. Je Hyuk Lee, Evan R. Daugharthy, Jonathan Scheiman et al. & George M. Church. (February 2014). Highly Multiplexed Subcellular RNA Sequencing in Situ. Science DOI: 10.1126/science.1250212
  22. Биологи изобрели субклеточное секвенирование РНК
  23. ТЫСЯЧИ МОЛЕКУЛ РНК ПОЛУЧИЛИ ВНУТРИКЛЕТОЧНУЮ ПРОПИСКУ
  24. Jakhesara SJ, Koringa PG, Bhatt VD, Shah TM, Vangipuram S, Shah S, Joshi CG. RNA-Seq reveals differentially expressed isoforms and novel splice variants in buccal mucosal cancer.Gene. 2013 Mar 1;516(1):24-32. doi: 10.1016/j.gene.2012.11.079. Epub 2012 Dec 20.PMID: 23266631
  25. Park E, Williams B, Wold BJ, Mortazavi A. «RNA editing in the human ENCODE RNA-seq data».Genome Res. 2012 Sep;22(9):1626-33. doi: 10.1101/gr.134957.111.PMID:22955975
  26. Peng Z, Cheng Y, Tan BC, Kang L, Tian Z, Zhu Y, Zhang W, Liang Y, Hu X, Tan X, Guo J, Dong Z, Liang Y, Bao L, Wang J. Comprehensive analysis of RNA-Seq data reveals extensive RNA editing in a human transcriptome. Nat Biotechnol. 2012 Feb 12;30(3):253-60. doi: 10.1038/nbt.2122.
  27. Wang W, Qin Z, Feng Z, Wang X, Zhang X. «Identifying differentially spliced genes from two groups of RNA-seq samples».Gene. 2013 Apr 10;518(1):164-70. doi: 10.1016/j.gene.2012.11.045. Epub 2012 Dec 8. PMID: 23228854
  28. Liu Q, Chen C, Shen E, Zhao F, Sun Z, Wu J. Detection, annotation and visualization of alternative splicing from RNA-Seq data with SplicingViewer. Genomics. 2012 Mar;99(3):178-82. doi: 10.1016/j.ygeno.2011.12.003. Epub 2011 Dec 28. PMID: 22226708
  29. Maher CA, Kumar-Sinha C, Cao X, Kalyana-Sundaram S, Han B, Jing X, Sam L, Barrette T, Palanisamy N, Chinnaiyan AM (January 2009). «Transcriptome Sequencing to Detect Gene Fusions in Cancer». Nature 458 (7234): 97—101. doi:10.1038/nature07638. PMC 2725402. PMID 19136943.
  30. Feng H, Qin Z, Zhang X. Opportunities and methods for studying alternative splicing in cancer with RNA-Seq. Cancer Lett. 2012 Nov 27. doi: pii: S0304-3835(12)00657-X. 10.1016/j.canlet.2012.11.010. [Epub ahead of print] PMID:23196057
  31. Teixeira MR (2006). «Recurrent fusion oncogenes in carcinomas». Ciritical Reviews in Oncogenesis 12 (3–4): 257–271. PMID 17425505.
  32. Maher CA, Kumar-Sinha C, Cao X, Kalyana-Sundaram S, Han B, Jing X, Sam L, Barrette T, Palanisamy N, Chinnaiyan AM (January 2009). «Transcriptome Sequencing to Detect Gene Fusions in Cancer». Nature 458 (7234): 97–101. DOI:10.1038/nature07638. PMID 19136943.
  33. ENCODE Project Consortium «An integrated encyclopedia of DNA elements in the human genome». Nature. 2012 Sep 6;489(7414):57-74. doi: 10.1038/nature11247.PMID:22955616
  34. Gerstein MB, Lu ZJ, Van Nostrand EL et al «Integrative analysis of the Caenorhabditis elegans genome by the modENCODE project». Science. 2010 Dec 24;330(6012):1775-87. doi: 10.1126/science.1196914. Epub 2010 Dec 22. Erratum in: Science. 2011 Jan 7;331(6013):30. PMID:2117797
  35. modENCODE Consortium, «Identification of functional elements and regulatory circuits by Drosophila modENCODE». Science. 2010 Dec 24;330(6012):1787-97. doi: 10.1126/science.1198374. Epub 2010 Dec 22.PMID:21177974

Литература[править | править вики-текст]

  • Wang Z, Gerstein M, Snyder M. (January 2009). «RNA-Seq: a revolutionary tool for transcriptomics». Nature Reviews Genetics 10 (1): 57—63. doi:10.1038/nrg2484. PMC 2949280. PMID 19015660.
  • Wilhelm BT, Marguerat S, Watt S, Schubert F, Wood V, Goodhead I, Penkett CJ, Rogers J, Bähler J. Dynamic repertoire of a eukaryotic transcriptome surveyed at single-nucleotide resolution. Nature. 2008 Jun 26;453(7199):1239-43. doi: 10.1038/nature07002. Epub 2008 May 18.
  • Nookaew I, Papini M, Pornputtapong N, Scalcinati G, Fagerberg L, Uhlén M, Nielsen J. A comprehensive comparison of RNA-Seq-based transcriptome analysis from reads to differential gene expression and cross-comparison with microarrays: a case study in Saccharomyces cerevisiae. Nucleic Acids Res. 2012 Nov 1;40(20):10084-97. doi: 10.1093/nar/gks804. Epub 2012 Sep 10.
  • Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, Pimentel H, Salzberg SL, Rinn JL, Pachter L. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat Protoc. 2012 Mar 1;7(3):562-78. doi: 10.1038/nprot.2012.016.
  • Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol. 2010 May;28(5):511-5. doi: 10.1038/nbt.1621. Epub 2010 May 2.
  • Drewe, P., Stegle, O., Hartmann, L., Kahles, A., Bohnert, R., Wachter, A., … & Rätsch, G. (2013). Accurate detection of differential RNA processing. Nucleic acids research, 41(10), 5189-5198. doi: 10.1093/nar/gkt211
  • Bhargava, V., Ko, P., Willems, E., Mercola, M., & Subramaniam, S. (2013) Quantitative Transcriptomics using Designed Primer-based Amplification. Scientific reports, 3, Article number: 1740 doi:10.1038/srep01740