ChIP-seq: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Строка 35: Строка 35:
===Биоинформатический анализ===
===Биоинформатический анализ===
Биоинформатический анализ данных секвенирования включает в себя следующие стадии:
Биоинформатический анализ данных секвенирования включает в себя следующие стадии:
<ref>{{cite journal |author=Furey TS |title=ChIP-seq and beyond: new and improved methodologies to detect and characterize protein-DNA interactions |journal=Nat. Rev. Genet. |volume=13 |issue=12 |pages=840–52 |year=2012 |month=December |pmid=23090257 |pmc=3591838 |doi=10.1038/nrg3306 |url=}} </ref>
<ref>{{cite journal |author=Furey TS |title=ChIP-seq and beyond: new and improved methodologies to detect and characterize protein-DNA interactions |journal=Nat. Rev. Genet. |volume=13 |issue=12 |pages=840–52 |year=2012 |month=December |pmid=23090257 |pmc=3591838 |doi=10.1038/nrg3306 |url=}} </ref> <ref>{{cite journal |author=Bailey T, Krajewski P, Ladunga I, ''et al.'' |title=Practical guidelines for the comprehensive analysis of ChIP-seq data |journal=PLoS Comput. Biol. |volume=9 |issue=11 |pages=e1003326 |year=2013 |month=November |pmid=24244136 |pmc=3828144 |doi=10.1371/journal.pcbi.1003326 |url=}} </ref>
* фильтрация ридов с низким качеством (програмные пакеты [http://www.bioinformatics.babraham.ac.uk/projects/fastqc/ FastQС], [http://hannonlab.cshl.edu/fastx_toolkit/ FastX ToolKit])
* фильтрация ридов с низким качеством (програмные пакеты [http://www.bioinformatics.babraham.ac.uk/projects/fastqc/ FastQС], [http://hannonlab.cshl.edu/fastx_toolkit/ FastX ToolKit])
* картирование ридов на геном ([http://bio-bwa.sourceforge.net/ BWA], [http://bowtie-bio.sourceforge.net/index.shtml Bowtie], [http://research-pub.gene.com/gmap/ GSNAP])
* картирование ридов на геном ([http://bio-bwa.sourceforge.net/ BWA], [http://bowtie-bio.sourceforge.net/index.shtml Bowtie], [http://research-pub.gene.com/gmap/ GSNAP])

Версия от 10:13, 30 марта 2014

ChIP-seq — это метод, используемый для анализа ДНК-белковых взаимодействий. ChIP-seq сочетает иммунопреципитацию хроматина (ChIP, Chromatin Immune Precipitation) и высокоэффективное секвенирование ДНК для определения участков связывания ДНК и белков. Данный метод может быть использован для картирования сайтов связывания любого изучаемого белка по всему геному. Ранее самым популярным методом для установления ДНК-белковых взаимодействий был ChIP-on-chip, сочетающий иммунопреципитацию хроматина с гибридизацией на микрочипах.


Использование

Основным вариантом использования ChIP-seq является изучение того, как транскрипционные факторы и другие ДНК связывающие белки влияют на фенотип. Определение того, как белки взаимодествуют с ДНК для регуляции экспрессии генов, необходимо для детального понимания многих биологических процессов. Эта эпигенетическая информация дополняет генотип и данные по экспрессии генов.

Участки ДНК, физически контактирующие с факторами транскрипции и другими белками могут быть изолированы методом иммунопреципитации хроматина. В ходе эксперимента получается библиотека фрагментов ДНК, связанных с исследуемым белком in vivo. Дальнейший анализ включает использование массивного параллельного секвенирования и баз данных полных геномов для определения положения участка связывания в геноме.

ChIP-seq применим для любых белков, которые осаждаются в ходе иммунопреципитации хроматина. Типичными примерами использования ChIP-seq является определение участков связывания факторов транскрипции, ДНК-полимеразы, структурных белков, а также модификаций гистонов и ДНК. В качестве альтернативы ChIP-seq был разработан ряд не использующих иммунопреципитацию методов (DNase-Seq и FAIRE-Seq) для определения свободных от нуклеосом участков ДНК.

Методика

Диаграмма, иллюстрирующая ChIP-seq

Иммунопреципитация хроматина (ChIP)

Иммунопреципитация хроматина - метод для специфического накопления коротких последовательностей ДНК, связвнных с bpexftvsv белком в живых клетках. Типичная методика включает в себя следующие старии:

  • образование обратимых сшивок между ДНК и взаимодействующими с ней белками
  • выделение ДНК и расщепление на фрагменты ультразвуком или эндонкулеазами
  • осаждение пришитыми к бусинам специфическими к исследуему белку антителами
  • разрушение сшивок между белком и ДНК, очистка

В результате удается специфически выделить те фрагменты ДНК, с которыми связался исследуемый белок.

У данной методики существует ряд ограничений. Так, обычно для ChIP необходимо значительное количество клеток (около 10 миллионов), что затрудняет применение данного метода на маленьких модельных организмов, а также ограничивает количество экспериментов, которые можно провести с ценным образцом. Ряд методов был разработан для преодаления данного ограничения, например Nano-ChIP-seq. [1]

Также, существуют вариации метода, направленные на повышение специфичности (ChIP-exo [2]). Так, длина типичного участка связывания белка составляет 6-20 нуклеотидов, а длина полученных фрагментов после ChIP - около 200, что делает определение места связывания не слишком точным.

Секвенирование

Данная стадия включает в себя определение первичной последовательности полученных после иммунопреципитации фрагментов ДНК любым доступным способом. В отличие от ChIP-on-Chip, в ChIP-seq для определения последовательности ДНК используется секвенирование нового поколения. В результате получается набор коротких перекрывающихся последовательностей (чтений, или ридов).

Биоинформатический анализ

Биоинформатический анализ данных секвенирования включает в себя следующие стадии: [3] [4]

  • фильтрация ридов с низким качеством (програмные пакеты FastQС, FastX ToolKit)
  • картирование ридов на геном (BWA, Bowtie, GSNAP)
  • фильтрация артефактов и ридов, которые картировались сразу в несколько мест на геноме (SAMTools, Picard Tools)

Базы данных

На данный момент существует ряд баз данны, в которых можно скачать результаты экспериментов ChIP-seq:

  • ENCODE - на сайте проекта можно скачать координаты участков связывания ДНК с транскрипционными факторами или модифицированными гистонами, полученными в результате ChIP-seq. В настоящее время есть данные по различным клеточным линиям и тканям мыши и человека.
  • Factorbook - база данных, сгенерированная на основе ENCODE
  • ChIPBase - помимо человека и мыши, доступны результаты экспериментов ChIP-seq собаки, курицы, дрозофилы и нематоды C. elegans.
  • ChEA - ChIP-seq человека, мыши и крысы, можно получить список участков связывания с различными белками, в которые попал исследуемый ген.
  • CTCFBSDB - база данных участков связывания инсулятора CTCF.
  • hmChIP - ChIP-seq и ChIP-chip человека и мыши.
  • HOCOMOCO - база данных участков связывания транскрипционных факторов человека.
  • JASPAR - профили участков связывания транскрипционных факторов на основе ChIP-seq различных эукариот.
  • SwissRegulon - база данных аннотированных регуляторных сайтов.
  • CistromeMap - ChIP-Seq и DNase-Seq человека и мыши.
  • CR Cistrome - интегрированная база данных регуляторов хроматина, доступны результаты экспериментов ChIP-seq человека и мыши.

Чувствительность метода

Чувствительность технологии зависит от "глубины" секвенирования (т.е. количества чтений), длины генома и других факторов. Глубина секвенирования последовательности непосредственно коррелирует с ценой. Если требуется отобразить связывающиеся белки в больших геномах с высокой чувствительностью, потребуются высокие затраты, т.к. будет необходимо большое число сиквенсовых тэгов. Это отличает данный метод от ChIP-chip, в котором такие расходы не коррелирует с чувствительностью.

В отличие от ChIP-методов, основанных на microarray-анализе, точность ChIP-seq не ограничивается расстоянием между заданными зондами. Путем интеграции большого количества коротких ридов с высокой точностью может быть получена локализация сайтов связывания. В сравнении с методами ChIP-chip, ChIP-seq, данные могут быть использованы для локализации сайта связывания внутри последовательности в несколько десятков пар оснований фактического сайта связывания белка. Плотность тегов на сайтах связывания является хорошим индикатором аффинности связи белок-ДНК, что позволяет легче количественно оценивать и сравнивать сродство белка к разным сайтам ДНК.

Текущие исследования

  • Изучение связывания белка STAT1 с ДНК. STAT1 - член семейства белков-преобразоваетлей сигналов и транскрипционны факторов, вовлеченный в регуляцию генов в ответ на сигналинг от разных типов интерферонов. ChIP-seq был использован для изучения целевых последоваетельностей ДНК STAT1 в клеточной линии HeLA S3. Производительность метода сравнивали альтернативными методиками изучени взаимодействий белок-ДНК ChIP-PCR и ChIP-chip. [5]
  • Нуклеосомная архитектура промотеров. С помощью ChIP-seq удалось установить, что возможно, у дрожжей имеются области промотеров длиной примерно 150 нуклеотидов, свободные от нуклеосом, с которых РНК-полимераза может инициировать транскрипцию. [6]
  • Полногенмный ChIP-seq. Данный метод был успешно примнен для полногеномнго поиска сайтов связывания 22 транскрипционных факторов в отсеквенированном геноме червя C. elegans. До 20% аннотированных генов-кандидатов были отнесены к факторам транскрипции. Были определены функции факторов транскрипции, некоторые из них регулируют гены других факторов транскрипции.[7]

Заключение

Примечания

  1. Adli M, Bernstein BE (2011). "Whole-genome chromatin profiling from limited numbers of cells using nano-ChIP-seq". Nat Protoc. 6 (10): 1656—68. doi:10.1038/nprot.2011.402. PMID 21959244. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка)
  2. Rhee HS, Pugh BF (2011). "Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution". Cell. 147 (6): 1408—19. doi:10.1016/j.cell.2011.11.013. PMC 3243364. PMID 22153082. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка)
  3. Furey TS (2012). "ChIP-seq and beyond: new and improved methodologies to detect and characterize protein-DNA interactions". Nat. Rev. Genet. 13 (12): 840—52. doi:10.1038/nrg3306. PMC 3591838. PMID 23090257. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка)
  4. Bailey T, Krajewski P, Ladunga I; et al. (2013). "Practical guidelines for the comprehensive analysis of ChIP-seq data". PLoS Comput. Biol. 9 (11): e1003326. doi:10.1371/journal.pcbi.1003326. PMC 3828144. PMID 24244136. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка); Явное указание et al. в: |author= (справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка) Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  5. Robertson G, Hirst M, Bainbridge M; et al. (2007). "Genome-wide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing". Nat. Methods. 4 (8): 651—7. doi:10.1038/nmeth1068. PMID 17558387. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка); Явное указание et al. в: |author= (справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  6. Schmid CD, Bucher P (2007). "ChIP-Seq data reveal nucleosome architecture of human promoters". Cell. 131 (5): 831—2, author reply 832–3. doi:10.1016/j.cell.2007.11.017. PMID 18045524. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка)
  7. Niu W, Lu ZJ, Zhong M; et al. (2011). "Diverse transcription factor binding features revealed by genome-wide ChIP-seq in C. elegans". Genome Res. 21 (2): 245—54. doi:10.1101/gr.114587.110. PMC 3032928. PMID 21177963. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка); Явное указание et al. в: |author= (справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)

Ссылки

  • ENCODE - главная страница проекта ENCODE
  • ChIPBase - главная страница проекта ChIPBase


Категория:Биоинформатика