ChIP-seq: различия между версиями
[непроверенная версия] | [непроверенная версия] |
Строка 35: | Строка 35: | ||
===Биоинформатический анализ=== |
===Биоинформатический анализ=== |
||
Биоинформатический анализ данных секвенирования включает в себя следующие стадии: |
Биоинформатический анализ данных секвенирования включает в себя следующие стадии: |
||
<ref>{{cite journal |author=Furey TS |title=ChIP-seq and beyond: new and improved methodologies to detect and characterize protein-DNA interactions |journal=Nat. Rev. Genet. |volume=13 |issue=12 |pages=840–52 |year=2012 |month=December |pmid=23090257 |pmc=3591838 |doi=10.1038/nrg3306 |url=}} </ref> |
<ref>{{cite journal |author=Furey TS |title=ChIP-seq and beyond: new and improved methodologies to detect and characterize protein-DNA interactions |journal=Nat. Rev. Genet. |volume=13 |issue=12 |pages=840–52 |year=2012 |month=December |pmid=23090257 |pmc=3591838 |doi=10.1038/nrg3306 |url=}} </ref> <ref>{{cite journal |author=Bailey T, Krajewski P, Ladunga I, ''et al.'' |title=Practical guidelines for the comprehensive analysis of ChIP-seq data |journal=PLoS Comput. Biol. |volume=9 |issue=11 |pages=e1003326 |year=2013 |month=November |pmid=24244136 |pmc=3828144 |doi=10.1371/journal.pcbi.1003326 |url=}} </ref> |
||
* фильтрация ридов с низким качеством (програмные пакеты [http://www.bioinformatics.babraham.ac.uk/projects/fastqc/ FastQС], [http://hannonlab.cshl.edu/fastx_toolkit/ FastX ToolKit]) |
* фильтрация ридов с низким качеством (програмные пакеты [http://www.bioinformatics.babraham.ac.uk/projects/fastqc/ FastQС], [http://hannonlab.cshl.edu/fastx_toolkit/ FastX ToolKit]) |
||
* картирование ридов на геном ([http://bio-bwa.sourceforge.net/ BWA], [http://bowtie-bio.sourceforge.net/index.shtml Bowtie], [http://research-pub.gene.com/gmap/ GSNAP]) |
* картирование ридов на геном ([http://bio-bwa.sourceforge.net/ BWA], [http://bowtie-bio.sourceforge.net/index.shtml Bowtie], [http://research-pub.gene.com/gmap/ GSNAP]) |
Версия от 10:13, 30 марта 2014
Эту статью Инкубатора предлагается удалить. |
ChIP-seq — это метод, используемый для анализа ДНК-белковых взаимодействий. ChIP-seq сочетает иммунопреципитацию хроматина (ChIP, Chromatin Immune Precipitation) и высокоэффективное секвенирование ДНК для определения участков связывания ДНК и белков. Данный метод может быть использован для картирования сайтов связывания любого изучаемого белка по всему геному. Ранее самым популярным методом для установления ДНК-белковых взаимодействий был ChIP-on-chip, сочетающий иммунопреципитацию хроматина с гибридизацией на микрочипах.
Использование
Основным вариантом использования ChIP-seq является изучение того, как транскрипционные факторы и другие ДНК связывающие белки влияют на фенотип. Определение того, как белки взаимодествуют с ДНК для регуляции экспрессии генов, необходимо для детального понимания многих биологических процессов. Эта эпигенетическая информация дополняет генотип и данные по экспрессии генов.
Участки ДНК, физически контактирующие с факторами транскрипции и другими белками могут быть изолированы методом иммунопреципитации хроматина. В ходе эксперимента получается библиотека фрагментов ДНК, связанных с исследуемым белком in vivo. Дальнейший анализ включает использование массивного параллельного секвенирования и баз данных полных геномов для определения положения участка связывания в геноме.
ChIP-seq применим для любых белков, которые осаждаются в ходе иммунопреципитации хроматина. Типичными примерами использования ChIP-seq является определение участков связывания факторов транскрипции, ДНК-полимеразы, структурных белков, а также модификаций гистонов и ДНК. В качестве альтернативы ChIP-seq был разработан ряд не использующих иммунопреципитацию методов (DNase-Seq и FAIRE-Seq) для определения свободных от нуклеосом участков ДНК.
Методика
Иммунопреципитация хроматина (ChIP)
Иммунопреципитация хроматина - метод для специфического накопления коротких последовательностей ДНК, связвнных с bpexftvsv белком в живых клетках. Типичная методика включает в себя следующие старии:
- образование обратимых сшивок между ДНК и взаимодействующими с ней белками
- выделение ДНК и расщепление на фрагменты ультразвуком или эндонкулеазами
- осаждение пришитыми к бусинам специфическими к исследуему белку антителами
- разрушение сшивок между белком и ДНК, очистка
В результате удается специфически выделить те фрагменты ДНК, с которыми связался исследуемый белок.
У данной методики существует ряд ограничений. Так, обычно для ChIP необходимо значительное количество клеток (около 10 миллионов), что затрудняет применение данного метода на маленьких модельных организмов, а также ограничивает количество экспериментов, которые можно провести с ценным образцом. Ряд методов был разработан для преодаления данного ограничения, например Nano-ChIP-seq. [1]
Также, существуют вариации метода, направленные на повышение специфичности (ChIP-exo [2]). Так, длина типичного участка связывания белка составляет 6-20 нуклеотидов, а длина полученных фрагментов после ChIP - около 200, что делает определение места связывания не слишком точным.
Секвенирование
Данная стадия включает в себя определение первичной последовательности полученных после иммунопреципитации фрагментов ДНК любым доступным способом. В отличие от ChIP-on-Chip, в ChIP-seq для определения последовательности ДНК используется секвенирование нового поколения. В результате получается набор коротких перекрывающихся последовательностей (чтений, или ридов).
Биоинформатический анализ
Биоинформатический анализ данных секвенирования включает в себя следующие стадии: [3] [4]
- фильтрация ридов с низким качеством (програмные пакеты FastQС, FastX ToolKit)
- картирование ридов на геном (BWA, Bowtie, GSNAP)
- фильтрация артефактов и ридов, которые картировались сразу в несколько мест на геноме (SAMTools, Picard Tools)
Базы данных
На данный момент существует ряд баз данны, в которых можно скачать результаты экспериментов ChIP-seq:
- ENCODE - на сайте проекта можно скачать координаты участков связывания ДНК с транскрипционными факторами или модифицированными гистонами, полученными в результате ChIP-seq. В настоящее время есть данные по различным клеточным линиям и тканям мыши и человека.
- Factorbook - база данных, сгенерированная на основе ENCODE
- ChIPBase - помимо человека и мыши, доступны результаты экспериментов ChIP-seq собаки, курицы, дрозофилы и нематоды C. elegans.
- ChEA - ChIP-seq человека, мыши и крысы, можно получить список участков связывания с различными белками, в которые попал исследуемый ген.
- CTCFBSDB - база данных участков связывания инсулятора CTCF.
- hmChIP - ChIP-seq и ChIP-chip человека и мыши.
- HOCOMOCO - база данных участков связывания транскрипционных факторов человека.
- JASPAR - профили участков связывания транскрипционных факторов на основе ChIP-seq различных эукариот.
- SwissRegulon - база данных аннотированных регуляторных сайтов.
- CistromeMap - ChIP-Seq и DNase-Seq человека и мыши.
- CR Cistrome - интегрированная база данных регуляторов хроматина, доступны результаты экспериментов ChIP-seq человека и мыши.
Чувствительность метода
Чувствительность технологии зависит от "глубины" секвенирования (т.е. количества чтений), длины генома и других факторов. Глубина секвенирования последовательности непосредственно коррелирует с ценой. Если требуется отобразить связывающиеся белки в больших геномах с высокой чувствительностью, потребуются высокие затраты, т.к. будет необходимо большое число сиквенсовых тэгов. Это отличает данный метод от ChIP-chip, в котором такие расходы не коррелирует с чувствительностью.
В отличие от ChIP-методов, основанных на microarray-анализе, точность ChIP-seq не ограничивается расстоянием между заданными зондами. Путем интеграции большого количества коротких ридов с высокой точностью может быть получена локализация сайтов связывания. В сравнении с методами ChIP-chip, ChIP-seq, данные могут быть использованы для локализации сайта связывания внутри последовательности в несколько десятков пар оснований фактического сайта связывания белка. Плотность тегов на сайтах связывания является хорошим индикатором аффинности связи белок-ДНК, что позволяет легче количественно оценивать и сравнивать сродство белка к разным сайтам ДНК.
Текущие исследования
- Изучение связывания белка STAT1 с ДНК. STAT1 - член семейства белков-преобразоваетлей сигналов и транскрипционны факторов, вовлеченный в регуляцию генов в ответ на сигналинг от разных типов интерферонов. ChIP-seq был использован для изучения целевых последоваетельностей ДНК STAT1 в клеточной линии HeLA S3. Производительность метода сравнивали альтернативными методиками изучени взаимодействий белок-ДНК ChIP-PCR и ChIP-chip. [5]
- Нуклеосомная архитектура промотеров. С помощью ChIP-seq удалось установить, что возможно, у дрожжей имеются области промотеров длиной примерно 150 нуклеотидов, свободные от нуклеосом, с которых РНК-полимераза может инициировать транскрипцию. [6]
- Полногенмный ChIP-seq. Данный метод был успешно примнен для полногеномнго поиска сайтов связывания 22 транскрипционных факторов в отсеквенированном геноме червя C. elegans. До 20% аннотированных генов-кандидатов были отнесены к факторам транскрипции. Были определены функции факторов транскрипции, некоторые из них регулируют гены других факторов транскрипции.[7]
Заключение
Примечания
- ↑ Adli M, Bernstein BE (2011). "Whole-genome chromatin profiling from limited numbers of cells using nano-ChIP-seq". Nat Protoc. 6 (10): 1656—68. doi:10.1038/nprot.2011.402. PMID 21959244.
{{cite journal}}
: Неизвестный параметр|month=
игнорируется (справка) - ↑ Rhee HS, Pugh BF (2011). "Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution". Cell. 147 (6): 1408—19. doi:10.1016/j.cell.2011.11.013. PMC 3243364. PMID 22153082.
{{cite journal}}
: Неизвестный параметр|month=
игнорируется (справка) - ↑ Furey TS (2012). "ChIP-seq and beyond: new and improved methodologies to detect and characterize protein-DNA interactions". Nat. Rev. Genet. 13 (12): 840—52. doi:10.1038/nrg3306. PMC 3591838. PMID 23090257.
{{cite journal}}
: Неизвестный параметр|month=
игнорируется (справка) - ↑ Bailey T, Krajewski P, Ladunga I; et al. (2013). "Practical guidelines for the comprehensive analysis of ChIP-seq data". PLoS Comput. Biol. 9 (11): e1003326. doi:10.1371/journal.pcbi.1003326. PMC 3828144. PMID 24244136.
{{cite journal}}
: Неизвестный параметр|month=
игнорируется (справка); Явное указание et al. в:|author=
(справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка) Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка) - ↑ Robertson G, Hirst M, Bainbridge M; et al. (2007). "Genome-wide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing". Nat. Methods. 4 (8): 651—7. doi:10.1038/nmeth1068. PMID 17558387.
{{cite journal}}
: Неизвестный параметр|month=
игнорируется (справка); Явное указание et al. в:|author=
(справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка) - ↑ Schmid CD, Bucher P (2007). "ChIP-Seq data reveal nucleosome architecture of human promoters". Cell. 131 (5): 831—2, author reply 832–3. doi:10.1016/j.cell.2007.11.017. PMID 18045524.
{{cite journal}}
: Неизвестный параметр|month=
игнорируется (справка) - ↑ Niu W, Lu ZJ, Zhong M; et al. (2011). "Diverse transcription factor binding features revealed by genome-wide ChIP-seq in C. elegans". Genome Res. 21 (2): 245—54. doi:10.1101/gr.114587.110. PMC 3032928. PMID 21177963.
{{cite journal}}
: Неизвестный параметр|month=
игнорируется (справка); Явное указание et al. в:|author=
(справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)