Секвенирование ДНК одиночных клеток: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
Нет описания правки
Строка 71: Строка 71:


=== Вариация числа копий участков ДНК ===
=== Вариация числа копий участков ДНК ===
[[Вариация числа копий генов|Вариации числа копий фрагментов ДНК]] приводят к ненормальному числу копий этих фрагментов; разнообразие этого типа генетического полиморфизма также влияет на здоровье людей<ref>{{Статья|автор=Richard Redon, Shumpei Ishikawa, Karen R. Fitch, Lars Feuk, George H. Perry|заглавие=Global variation in copy number in the human genome|ссылка=http://www.nature.com/nature/journal/v444/n7118/full/nature05329.html|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1038/nature05329}}</ref><ref>{{Статья|автор=Feng Zhang, Wenli Gu, Matthew E. Hurles, James R. Lupski|заглавие=Copy Number Variation in Human Health, Disease, and Evolution|ссылка=http://dx.doi.org/10.1146/annurev.genom.9.081307.164217|издание=|год=|том=|выпуск=|страницы=|doi=10.1146/annurev.genom.9.081307.164217}}</ref>. Некоторые исследования подчеркивают их связь с развитием опухолей<ref>{{Статья|автор=Bernd Frank, Justo Lorenzo Bermejo, Kari Hemminki, Christian Sutter, Barbara Wappenschmidt|заглавие=Copy number variant in the candidate tumor suppressor gene MTUS1 and familial breast cancer risk|ссылка=http://carcin.oxfordjournals.org/content/28/7/1442|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1093/carcin/bgm033}}</ref>, аутоиммунных заболеваний<ref>{{Статья|автор=H. Schaschl, T. J. Aitman, T. J. Vyse|заглавие=Copy number variation in the human genome and its implication in autoimmunity|ссылка=http://onlinelibrary.wiley.com/doi/10.1111/j.1365-2249.2008.03865.x/abstract|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1111/j.1365-2249.2008.03865.x}}</ref>, [[Аутизм|аутизма]]<ref>{{Статья|автор=Joseph T. Glessner, Kai Wang, Guiqing Cai, Olena Korvatska, Cecilia E. Kim|заглавие=Autism genome-wide copy number variation reveals ubiquitin and neuronal genes|ссылка=http://www.nature.com/nature/journal/v459/n7246/full/nature07953.html|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1038/nature07953}}</ref> и др.. Здесь, как и при поиске однонуклеотидных полиморфизмов, используются в основном те же алгоритмы, что и для обычного секвенирования CNV-seq, PenCNV, CNAseg, Readdepth, и cn.MOPS.
[[Вариация числа копий генов|Вариации числа копий фрагментов ДНК]] приводят к ненормальному числу копий этих фрагментов; разнообразие этого типа генетического полиморфизма также влияет на здоровье людей<ref>{{Статья|автор=Richard Redon, Shumpei Ishikawa, Karen R. Fitch, Lars Feuk, George H. Perry|заглавие=Global variation in copy number in the human genome|ссылка=http://www.nature.com/nature/journal/v444/n7118/full/nature05329.html|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1038/nature05329}}</ref><ref>{{Статья|автор=Feng Zhang, Wenli Gu, Matthew E. Hurles, James R. Lupski|заглавие=Copy Number Variation in Human Health, Disease, and Evolution|ссылка=http://dx.doi.org/10.1146/annurev.genom.9.081307.164217|издание=|год=|том=|выпуск=|страницы=|doi=10.1146/annurev.genom.9.081307.164217}}</ref>. Некоторые исследования подчеркивают их связь с развитием опухолей<ref>{{Статья|автор=Bernd Frank, Justo Lorenzo Bermejo, Kari Hemminki, Christian Sutter, Barbara Wappenschmidt|заглавие=Copy number variant in the candidate tumor suppressor gene MTUS1 and familial breast cancer risk|ссылка=http://carcin.oxfordjournals.org/content/28/7/1442|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1093/carcin/bgm033}}</ref>, аутоиммунных заболеваний<ref>{{Статья|автор=H. Schaschl, T. J. Aitman, T. J. Vyse|заглавие=Copy number variation in the human genome and its implication in autoimmunity|ссылка=http://onlinelibrary.wiley.com/doi/10.1111/j.1365-2249.2008.03865.x/abstract|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1111/j.1365-2249.2008.03865.x}}</ref>, [[Аутизм|аутизма]]<ref>{{Статья|автор=Joseph T. Glessner, Kai Wang, Guiqing Cai, Olena Korvatska, Cecilia E. Kim|заглавие=Autism genome-wide copy number variation reveals ubiquitin and neuronal genes|ссылка=http://www.nature.com/nature/journal/v459/n7246/full/nature07953.html|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1038/nature07953}}</ref> и др.. Здесь, как и при поиске однонуклеотидных полиморфизмов, используются в основном те же алгоритмы, что и для обычного секвенирования: CNV-seq<ref>{{Статья|автор=Chao Xie, Martti T Tammi|заглавие=CNV-seq, a new method to detect copy number variation using high-throughput sequencing|ссылка=http://www.biomedcentral.com/1471-2105/10/80|язык=En|издание=|год=|том=|выпуск=|doi=10.1186/1471-2105-10-80}}</ref>, PenCNV<ref>{{Статья|автор=Kai Wang, Mingyao Li, Dexter Hadley, Rui Liu, Joseph Glessner|заглавие=PennCNV: An integrated hidden Markov model designed for high-resolution copy number variation detection in whole-genome SNP genotyping data|ссылка=http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2045149/|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1101/gr.6861907}}</ref>, CNAseg<ref>{{Статья|автор=Sergii Ivakhno, Tom Royce, Anthony J. Cox, Dirk J. Evers, R. Keira Cheetham|заглавие=CNAseg—a novel framework for identification of copy number changes in cancer from second-generation sequencing data|ссылка=http://bioinformatics.oxfordjournals.org/content/26/24/3051|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1093/bioinformatics/btq587}}</ref>, Readdepth<ref>{{Статья|автор=Christopher A. Miller, Oliver Hampton, Cristian Coarfa, Aleksandar Milosavljevic|заглавие=ReadDepth: A Parallel R Package for Detecting Copy Number Alterations from Short Sequencing Reads|ссылка=http://dx.plos.org/10.1371/journal.pone.0016327|издание=|том=|выпуск=|doi=10.1371/journal.pone.0016327}}</ref>, и cn.MOPS<ref>{{Статья|автор=Günter Klambauer, Karin Schwarzbauer, Andreas Mayr, Djork-Arné Clevert, Andreas Mitterecker|заглавие=cn.MOPS: mixture of Poissons for discovering copy number variations in next-generation sequencing data with a low false discovery rate|ссылка=http://nar.oxfordjournals.org/content/40/9/e69|язык=en|издание=|год=|том=|выпуск=|страницы=|issn=|doi=10.1093/nar/gks003}}</ref>. Для того, чтобы учитывать вносимый шум, необходимо произвести анализ влияния методов амплификации на появление и исчезновение вариаций числа копий ДНК<ref>{{Статья|автор=Luwen Ning, Geng Liu, Guibo Li, Yong Hou, Yin Tong|заглавие=Current challenges in the bioinformatics of single cell genomics|ссылка=http://journal.frontiersin.org/article/10.3389/fonc.2014.00007/abstract|издание=|год=|том=|страницы=|doi=10.3389/fonc.2014.00007}}</ref>.


=== Сравнительный анализ клеток ===
=== Сравнительный анализ клеток ===

Версия от 15:19, 10 апреля 2016

Секвенирование ДНК одиночной клеток (Single-cell DNA sequencing) – подход, позволяющий получить данные о последовательности ДНК отдельной клетки с помощью технологии секвенирования и, следовательно, выявлять различия между отдельными клетками одноклеточных организмов, органов, тканей и клеточных субпопуляций многоклеточных организмов. Подход позволяет анализировать функциональные особенности клетки в контексте микроокружения. Секвенирование генома единичной клетки включает несколько шагов: выделение одной клетки, полногеномная амплификация, создание библиотек и секвенирование ДНК с использованием методов секвенирования нового поколения.

С появлением разнообразных методов секвенирования возникла возможность устанавливать последовательность геномной ДНК. Однако большинство данных на текущий момент получены при секвенировании образцов геномной ДНК, выделенных из популяций микроорганизмов или клеточных субпопуляций многоклеточных организмов[1]. Однако известно, что разнообразие внутри обеих групп может быть существенным, так как сами клетки вносят разный вклад в существование популяции или организма.

Секвенирование генома единичной клетки позволяет перевести изучение генома на клеточный уровень. Сегодня это помогает решать такие задачи, как de novo секвенирование некультивируемых микроорганизмов [2], избавление от генетического мозаицизма в нормальных и патологических случаях[3], выявление и изучение вклада клеточных субпопуляций опухолей в развитие рака и возникновение устойчивости к лечению[4].

Технологические задачи

Перед секвенированием ДНК одиночных клеток стоят задачи физического выделения отдельных клеток, выбора метода амплификации с наименьшей вероятностью внесения ошибок для получения достаточного количества материала и выбора способа секвенирования. Для максимизации качества данных, полученных с помощью описываемого подхода, а также для возможности отличить полученный сигнал от шума все шаги должны быть внимательно рассмотрены.

Изолирование отдельных клеток

Первым шагом в изолировании клеток является создание суспензии жизнеспособных клеток, не связанных друг с другом. Целью изолирования может быть как случайный выбор клеток для создания репрезентативной выборочной совокупности при анализе состава субпопуляций, так и целенаправленный поиск определенных клеток. При исследовании твердых тканей необходима предварительная механическая или химическая диссоциация образца, при этом условия диссоциации должны одинаково действовать на все субпопуляции клеток тканей. Это необходимо для создания несмещенной относительно исходного набора клеток выборки, где сохраняется изначальная представленность клеток, что может быть важно для анализа состава субпопуляций. Стоит учитывать, что условия диссоциации нормальных и нездоровых тканей могут различаться, поэтому на данном этапе важно подобрать соответствующие условия. Работа с цельными образцами тканей также возможна, например, с помощью лазерной захватывающей микродиссекции[5].

После получения суспензии можно приступать к изолированию клеток методами серийного разведения[6], микропипетирования[7], разведения в микроячейках[8], с использованием оптического пинцета. Метод проточной флуоресцентной цитометрии может использоваться для отделения клеток с определенными флуоресцентными свойствами, которые могут быть как естественными, так и введены экспериментатором. Большое развитие в последнее время получили автоматизированные методы микроманипуляции[9][10]; взятие нанобиопсий уже позволяет исследовать ДНК отдельных органелл[11].

Изолированные клетки впоследствии подвергаются лизису.

Полногеномная амплификация

Следующий шаг – полногеномная амплификация (whole genome amplification, WGA),- служит для наработки такого количества ДНК, которого достаточно для детекции сигнала и его выделения из шума в дальнейшем при секвенировании. При этом желательно минимизировать внесение таких артефактов, как предпочтительная амплификация простых последовательностей, потеря генома, введение случайных мутаций и формирование химерных последовательностей. За последнее время появился набор возможностей для решения этой задачи. Использование чистой ПЦР не оправдало себя ввиду, например, повышенной частоты введения ошибок термостабильными полимеразами. Поэтому наибольшего распространения добились изотермические и гибридные методы, такие как  метод амплификации со множественным замещением цепи (MDA) и MALBAC(Multiple Annealing and Looping Based Amplification Cycles).

MDA

MDA позволяет быстро амплифицировать ДНК, не задействуя ПЦР[12]. Метод основан на использовании фаговой phi29 полимеразы, которая характеризуется повышенной процессивностью (участки свыше 10 kb) и низкой частотой ошибок (1 на 106−107 оснований). Реакция происходит следующим образом: гексамерные праймеры отжигаются на матрице, элонгируются посредством полимеразы; когда фермент встречает другой праймер (который также элонгируется), то он вытесняет (замещает) его и продолжает свой путь по матрице. Замещенный новосинтезированный участок служит местом посадки новых праймеров и становится матрицей. Таким образом формируется ветвистое дерево, где синтез происходит на каждой ветви. В конце процедуры полимераза ингибируется, добавляется S1 нуклеаза для отщепления ветвей в местах ветвления и ДНК-полимераза I для достраивания образующихся одноцепочечных участков.

Метод имеет ряд проблем, таких как потеря аллелей, предпочтительная амплификация и взаимодействия между праймерами. Первая проблема возникает вследствие случайной амплификации только одного из аллелей в гетерозиготах, в результате чего гетерозиготы неверно определяются как гомозиготы. Из-за высокой частоты проявления этого эффекта (0-60%[12]) уменьшается точность генотипирования. Вторая проблема заключается в сверхамплификации одного аллеля по сравнению с другими. Взаимодействия между гексамерными праймерами происходят вследствие случайного характера последовательностей; их можно значительно уменьшить, введя ограничения при синтезе этих праймеров.

MALBAC

MALBAC - гибридный линейный метод полногеномной амплификации. Основа метода - специальные праймеры: они имеют длину 35 нуклеотидов, 27 из которых одинаковы во всех праймерах (GTG AGT GAT GGT TGA GGT AGT GTG GAG), а 8 оставшихся нуклеотидов варьируются. Весь процесс амплификации описывается следующим образом:

1) Плавление (94°С) двухцепочечной ДНК с образованием одноцепочечных фрагментов.

2) Охлаждение (0°С), добавление праймеров и полимеразы.

3) Отжиг праймеров в случайных местах на матрице. Bst ДНК-полимераза удлиняет праймеры с образованием полуампликона при 64°С. Все встречные праймеры смещаются с матрицы.

4) Плавление (94°С), отделение полуампликона от матрицы.

5) Охлаждение (0°С), добавление праймеров и полимеразы. Праймеры эффективно связываются и с матрицей, и с полуампликоном.

6) Bst ДНК-полимераза удлиняет праймеры при 64°С. На исходной матрице синтезируются полуампликоны, на полуампликонах, полученных ранее, синтезируются полные ампликоны.

7) Плавление (94°С).

8) Образование петель (58°С): у полных ампликонов 3' и 5' концы комплементарны друг другу и образуют петлю, не допуская использования полного ампликона в качестве матрицы.

9) Повторение шагов 5-8 пять раз.

10) ПЦР с использованием 27 общих нуклеотидов в качестве праймеров для амплификации только полных ампликонов.

Преимуществом метода является уменьшение шума, связанного с экспоненциальным характером ПЦР амплификации, благодаря введению предварительной квази-линейной амплификации. Это позволило увеличить покрытие генома (доля генома, покрытая хотя бы одним ридом), уменьшить вероятность потери аллелей и однонуклеотидных полиморфизмов (SNPs)[13]. Помимо этого, на вход требуется очень небольшое количество исходной ДНК, однако любое загрязнение образцов способно значительно повлиять на результаты секвенирования[13].

Недостатком является то, что для избавления от ложно-положительных результатов необходимо сравнивать результаты секвенирования 2-3 клеток как из той же, так и из иной клеточных линий[13]. При этом может теряться часть полиморфизмов, так как клетки, принадлежащие одной клеточной линии, все же имеют некоторые различия в геноме. Кроме того, используемая bst ДНК-полимераза имеет высокую частоту ошибок (1 на 105 оснований)[14].

Сравнение методов полногеномной амплификации

В последнее время было проведено несколько исследований, посвященных сравнению этих методов[15][16][17]. Результатом одного из исследований стал вывод о том, что MDA имеет большее покрытие, чем MALBAC (84% и 52%), что позволяет более точно определять однонуклеотидные полиморфизмы[15]. Однако MALBAC обеспечивает более равномерное покрытие, и поэтому дает возможность более точно выявлять вариации числа копий (CNVs)[15]. Интересно, что при секвенировании некоторых клеток уровень детекции вариаций числа копий методом MDA был сопоставим с MALBAC[15]. Другие авторы также подтверждают разницу в покрытии между MDA и MALBAC (84% и 72%) и сравнительно более высокую равномерность покрытия MALBAC (коэффициент вариации 0,10 против 0,21 у MDA)[16]. Показано, что MDA дает меньше ложно-положительных результатов, но число ложно-отрицательных результатов меняется от эксперимента к эксперименту[16]. MALBAC дает меньшую частоту потери аллелей (21%), однако и покрытие его меньше, чем у MDA[16]. В целом не ясно, какой приводит к меньшему количеству ложно-отрицательных результатов, так как MDA покрывает большую часть генома, но при этом теряет больше аллелей из-за предпочтительной амплификации только одного из аллелей в гетерозиготе[12][16].

Таким образом, MDA и MALBAC имеют набор преимуществ и недостатков, и выбор должен зависеть от поставленной задачи.

Создание библиотеки

После амплификации можно приступать к приготовлению библиотек с помощью коммерческих наборов. Здесь возможно несколько вариантов: выбор определенного локуса, выбор экзома или всего генома для дальнейшего секвенирования. Каждый из этих вариантов предполагает определенные значения покрытия, склонности к ошибкам и стоимости[18]. Выбор небольших участков позволяет сфокусироваться на областях, вносящих наибольший биологический вклад в работу изучаемой системы. При это уменьшается цена исследования и вероятность внесения ошибок при подготовке проб. Использование референсного генома позволяет уменьшить ложно-положительные результаты, хотя и ограничивает определяемые однонуклеотидные полиморфизмы теми, что присутствуют в референсном геноме. Секвенирование экзома позволяет выделить уникальные особенности клеток, однако с ростом длины секвенируемого участка растет вероятность внесения ошибок в ходе амплификации. Использование всего генома позволяет выявить некодирующие и структурные участки, однако стоимость исследования резко возрастает, что затрудняет полногеномное секвенирование многих клеток[18].

ДНК из созданных тем или иным способом библиотек используется в секвенировании одним из существующих методов.

Обработка данных

Распространенные ошибки

Большинство артефактов секвенирования возникают при подготовке образцов: изоляция клеток, загрязнение геномной ДНК, амплификация и создание библиотек, - все эти шаги привносят дополнительные мутации, приводят к потере покрытия, уменьшению однородности покрытия, смещениям в выборке при предпочтительном отборе определенных групп клеток и амплификации определенных последовательностей ДНК, являются причиной потери аллелей гетерозигот. Следует также принимать во внимание клеточные линии, на которых проводится оптимизация всех стадий секвенирования: не все клетки диплоидны, есть и гаплоидные, и анеуплоидные популяции, которые могут значительно влиять на эксперимент[4]. Препятствием на пути сравнения различных результатов в этой области подчас является отсутствие информации об общем количестве оцененных клеток и мере оценки качества секвенирования в конкретных работах[18].

Однонуклеотидные полиморфизмы

Однонуклеотидные полиморфизмы, согласно проекту 1000 геномов, вносят наибольшее разнообразие в геном человека[19]: на карте гаплотипа подтверждено 38 млн однонуклеотидных полиморфизмов, 1,4 млн вставок/делеций и более 14 тыс крупных делеций[19]. Также предполагается, что многие комплексные заболевания, такие как болезнь Альцгеймера[20], различные виды рака[21], аутоиммунные заболевания[22] могут быть связаны именно с наличием полиморфизмов.

Сегодня поиск полиморфизмов в данных секвенирования отдельных клеток опирается на те же алгоритмы, что и анализ результатов обычного секвенирования: GATK[23], SNPdetector[24], SOAPsnp[25], VarScan[26]. Однако есть отличия между секвенированием популяции клеток и секвенированием отдельных клеток: в последнем случае меньше покрытие генома и выше уровень ложно-положительных результатов.

Вариация числа копий участков ДНК

Вариации числа копий фрагментов ДНК приводят к ненормальному числу копий этих фрагментов; разнообразие этого типа генетического полиморфизма также влияет на здоровье людей[27][28]. Некоторые исследования подчеркивают их связь с развитием опухолей[29], аутоиммунных заболеваний[30], аутизма[31] и др.. Здесь, как и при поиске однонуклеотидных полиморфизмов, используются в основном те же алгоритмы, что и для обычного секвенирования: CNV-seq[32], PenCNV[33], CNAseg[34], Readdepth[35], и cn.MOPS[36]. Для того, чтобы учитывать вносимый шум, необходимо произвести анализ влияния методов амплификации на появление и исчезновение вариаций числа копий ДНК[37].

Сравнительный анализ клеток

Одной из стратегий кластеризации клеток исходя из геномных данных является введение функции расстояний, которая обеспечивает количественную оценку различий между парами образцов[38]. В данном случае Мера Жаккара считается наиболее подходящей ввиду бинарной природы генетических данных (см. ниже)[39]. Альтернативой основанным на функции расстояния методам является основанная на модели кластеризация, предполагающая вероятностный подход: вместо "жестких" расстояний вводятся "мягкие" вероятности происхождения клеток от различных клонов.

Представив данные секвенирования единичных клеток в качестве матрицы, где по вертикали отмечены интересующие нас мутации, а по горизонтали - клетки, заполняем ее 0 и 1 в зависимости от присутствия конкретной мутации в конкретной клетке. Если исследуется опухоль, то для нее с течением времени характерны экспансия одних клонов и исчезновение других[40]. При этом мы не знаем, сколько каких клонов присутствует, и предполагаем, что часть данных потеряна в ходе подготовки проб.

Параметры модели, такие как вероятность клетки произойти от определенного клона, а также уровень ложно-отрицательных результатов, могут быть оценены посредством алгоритма максимизации ожидания[41]. Тогда проблема определения числа клонов сводится к выбору статистической модели, которая наилучшим образом описывает данные секвенирования; оценка проводится с помощью информационных критериев Байеса и Акаике[42]. Существует и гибридный подход, позволяющий осуществлять первоначальную кластеризацию с помощью функции расстояния, что увеличивает скорость основанной на модели кластеризации, требующей больших вычислительных мощностей[43]. Основываясь на результатах кластеризации, строится профиль консенсусных клональных мутаций[44]. По нему с помощью различных методов построения деревьев можно выявлять взаимоотношения между разными клонами. Так, например, можно продемонстрировать эволюционную историю опухоли[44].

Примеры применения

Перспективы

На данный момент основную проблему представляет наличие шага амплификации геномной ДНК, ответственного за внесение наибольшего числа артефактов. Требования к количеству ДНК при приготовлении библиотек все уменьшаются, и уже было продемонстрировано прямое создание библиотек из выделенной ДНК[45][46]. Более того, была показана возможность вовсе обходиться без библиотек, подавая на секвенирование выделенную из клетки ДНК[47]. Существует также возможность выявления эпигенетической информации, такой, как поиск паттернов метилирования[48][49] и захват конформационного состояния хромосом[50]. Сегодня ученые обычно оперируют десятками-сотнями клеток, но развитие автоматических платформ для захвата клеток, амплификации ДНК и приготовления библиотек существенно увеличит масштабы и доступность анализа отдельных клеток, позволяя проводить более крупные эксперименты в короткий срок[51].

Применение метода секвенирования ДНК отдельных клеток вместе с эпигеномными и транскриптомными исследованиями позволит точно классифицировать клетки и дополнить существующий взгляд на клеточные популяции[51]. Также станет возможным установление взаимоотношений между последовательностью генома, эпигенетическим статусом и экспрессией генов, определение функциональных возможностей клеток[51].

Список литературы

  1. Tringe SG, von Mering C, Kobayashi A, Salamov AA, Chen K, Chang HW, Podar M, Short JM, Mathur EJ, Detter JC, Bork P, Hugenholtz P, Rubin EM. Comparative Metagenomics of Freshwater Microbial Communities (англ.).
  2. Martin, Hector Garcia Szeto, ErnestPlatt, DarrenHugenholtz, Philip Relman, David a Quake, Stephen R. Dissecting biological ‘‘dark matter’’ with single-cell genetic analysis of rare and uncultivated TM7 microbes from the human mouth (англ.).
  3. McConnell, Michael J Lindberg, Michael R Brennand, Kristen J Piper, Julia C Voet, Thierry Cowing-Zitron, Chris Shumilina, Svetlana Lasken, Roger S Vermeesch, Joris R Hall, Ira M Gage, Fred H. Mosaic Copy Number Variation in Human Neurons (англ.).
  4. 1 2 Wang, Yong Waters, Jill Leung, Marco L Unruh, Anna Roh, Whijae Shi, Xiuqing Chen, Ken Scheet, Paul Vattathil, Selina Liang, Han Multani, Asha Zhang, Hong Zhao, Rui Michor, Franziska Meric-Bernstam, Funda Navin, Nicholas E. Clonal evolution in breast cancer revealed by single nucleus genome sequencing (англ.).
  5. Emmert-Buck MR, Bonner RF, Smith PD, Chuaqui RF, Zhuang Z, Goldstein SR, Weiss RA, Liotta LA. Laser capture microdissection (англ.).
  6. Richard G Ham. Clonal Growth of Mammalian Cells in a Chemically Defined, Synthetic Medium (англ.).
  7. Zong, Chenghang Lu, Sijia Chapman, Alec R Xie, X Sunney. Genome-Wide Detection of Single Nucleotide and Copy Number Variations of a Single Human Cell (англ.).
  8. Jeff Gole, Athurva Gore, Andrew Richards, Yu-Jui Chiu, Ho-Lim Fung, Diane Bushman, Hsin-I Chiang, Jerold Chun, Yu-Hwa Lo, and Kun Zhang. Massively parallel polymerase cloning and genome sequencing of single cells using nanoliter microwells (англ.).
  9. White, A. K. VanInsberghe, M. Petriv, O. I. Hamidi, M. Sikorski, D. Marra, M. A. Piret, J. Aparicio, S. Hansen, C. L. High-throughput microfluidic single-cell RT-qPCR (англ.).
  10. Macosko, E Z Basu, A Satija, R Nemesh, J Shekhar, K Goldman, M Tirosh, I Bialas, A R Kamitaki, N Martersteck, E M Trombetta, J J Weitz, D A Sanes, J R Shalek, A K Regev, A McCarroll, S A. Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets (англ.).
  11. Actis P, Maalouf MM, Kim HJ, Lohith A, Vilozny B, Seger RA, Pourmand N. Compartmental genomics in living cells revealed by single-cell nanobiopsy (англ.).
  12. 1 2 3 J. Guillermo Paez, Ming Lin, Rameen Beroukhim, Jeffrey C. Lee, Xiaojun Zhao. Genome coverage and sequence fidelity of ϕ29 polymerase‐based multiple strand displacement whole genome amplification (англ.). — doi:10.1093/nar/gnh069.
  13. 1 2 3 Chenghang Zong, Sijia Lu, Alec R. Chapman, X. Sunney Xie. Genome-Wide Detection of Single-Nucleotide and Copy-Number Variations of a Single Human Cell (англ.). — doi:10.1126/science.1229164.
  14. Ausubel, F.M. et al. Vol. I., John Wiley & Songs, Inc. CURRENT PROTOCOLS IN MOLECULAR BIOLOGY. — 1995.
  15. 1 2 3 4 Yong Hou, Kui Wu, Xulian Shi, Fuqiang Li, Luting Song. Comparison of variations detection between whole-genome amplification methods used in single-cell resequencing (англ.). — doi:10.1186/s13742-015-0068-3.
  16. 1 2 3 4 5 Lei Huang, Fei Ma, Alec Chapman, Sijia Lu, Xiaoliang Sunney Xie. Single-Cell Whole-Genome Amplification and Sequencing: Methodology and Applications. — doi:10.1146/annurev-genom-090413-025352.
  17. Minfeng Chen, Pengfei Song, Dan Zou, Xuesong Hu, Shancen Zhao. Comparison of Multiple Displacement Amplification (MDA) and Multiple Annealing and Looping-Based Amplification Cycles (MALBAC) in Single-Cell Sequencing. — doi:10.1371/journal.pone.0114520.
  18. 1 2 3 Charles Gawad, Winston Koh, Stephen R. Quake. Single-cell genome sequencing: current state of the science. — doi:10.1038/nrg.2015.16.
  19. 1 2 The 1000 Genomes Project Consortium. An integrated map of genetic variation from 1,092 human genomes (англ.). — doi:10.1038/nature11632.
  20. E. R. Martin, E. H. Lai, J. R. Gilbert, A. R. Rogala, A. J. Afshari. SNPing away at complex diseases: analysis of single-nucleotide polymorphisms around APOE in Alzheimer disease. — doi:10.1086/303003.
  21. Zhu, Y Spitz, MR Lei, L Mills, GB Wu, X. A single nucleotide polymorphism in the matrix metalloproteinase-1 promoter enhances lung cancer susceptibility (англ.).
  22. H. Schaschl, T. J. Aitman, T. J. Vyse. Copy number variation in the human genome and its implication in autoimmunity (англ.). — doi:10.1111/j.1365-2249.2008.03865.x.
  23. Aaron McKenna, Matthew Hanna, Eric Banks, Andrey Sivachenko, Kristian Cibulskis. The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data. — doi:10.1101/gr.107524.110.
  24. Jinghui Zhang, David A Wheeler, Imtiaz Yakub, Sharon Wei, Raman Sood. SNPdetector: A Software Tool for Sensitive and Accurate SNP Detection. — doi:10.1371/journal.pcbi.0010053.
  25. Ruiqiang Li, Yingrui Li, Xiaodong Fang, Huanming Yang, Jian Wang. SNP detection for massively parallel whole-genome resequencing. — doi:10.1101/gr.088013.108.
  26. Daniel C. Koboldt, Ken Chen, Todd Wylie, David E. Larson, Michael D. McLellan. VarScan: variant detection in massively parallel sequencing of individual and pooled samples (англ.). — doi:10.1093/bioinformatics/btp373.
  27. Richard Redon, Shumpei Ishikawa, Karen R. Fitch, Lars Feuk, George H. Perry. Global variation in copy number in the human genome (англ.). — doi:10.1038/nature05329.
  28. Feng Zhang, Wenli Gu, Matthew E. Hurles, James R. Lupski. Copy Number Variation in Human Health, Disease, and Evolution. — doi:10.1146/annurev.genom.9.081307.164217.
  29. Bernd Frank, Justo Lorenzo Bermejo, Kari Hemminki, Christian Sutter, Barbara Wappenschmidt. Copy number variant in the candidate tumor suppressor gene MTUS1 and familial breast cancer risk (англ.). — doi:10.1093/carcin/bgm033.
  30. H. Schaschl, T. J. Aitman, T. J. Vyse. Copy number variation in the human genome and its implication in autoimmunity (англ.). — doi:10.1111/j.1365-2249.2008.03865.x.
  31. Joseph T. Glessner, Kai Wang, Guiqing Cai, Olena Korvatska, Cecilia E. Kim. Autism genome-wide copy number variation reveals ubiquitin and neuronal genes (англ.). — doi:10.1038/nature07953.
  32. Chao Xie, Martti T Tammi. CNV-seq, a new method to detect copy number variation using high-throughput sequencing (англ.). — doi:10.1186/1471-2105-10-80.
  33. Kai Wang, Mingyao Li, Dexter Hadley, Rui Liu, Joseph Glessner. PennCNV: An integrated hidden Markov model designed for high-resolution copy number variation detection in whole-genome SNP genotyping data. — doi:10.1101/gr.6861907.
  34. Sergii Ivakhno, Tom Royce, Anthony J. Cox, Dirk J. Evers, R. Keira Cheetham. CNAseg—a novel framework for identification of copy number changes in cancer from second-generation sequencing data (англ.). — doi:10.1093/bioinformatics/btq587.
  35. Christopher A. Miller, Oliver Hampton, Cristian Coarfa, Aleksandar Milosavljevic. ReadDepth: A Parallel R Package for Detecting Copy Number Alterations from Short Sequencing Reads. — doi:10.1371/journal.pone.0016327.
  36. Günter Klambauer, Karin Schwarzbauer, Andreas Mayr, Djork-Arné Clevert, Andreas Mitterecker. cn.MOPS: mixture of Poissons for discovering copy number variations in next-generation sequencing data with a low false discovery rate (англ.). — doi:10.1093/nar/gks003.
  37. Luwen Ning, Geng Liu, Guibo Li, Yong Hou, Yin Tong. Current challenges in the bioinformatics of single cell genomics. — doi:10.3389/fonc.2014.00007.
  38. Michael B. Eisen, Paul T. Spellman, Patrick O. Brown, David Botstein. Cluster analysis and display of genome-wide expression patterns (англ.). — doi:10.1073/pnas.95.25.14863.
  39. Dmitry Prokopenko, Julian Hecker, Edwin K. Silverman, Marcello Pagano, Markus M. Nöthen. Utilizing the Jaccard index to reveal population stratification in sequencing data: a simulation study and an application to the 1000 Genomes Project (англ.). — doi:10.1093/bioinformatics/btv752.
  40. Mel Greaves, Carlo C. Maley. Clonal evolution in cancer. — doi:10.1038/nature10762.
  41. Dempster, A.P. AP Laird, N.M. NM Rubin, DB Donald B. Maximum likelihood from incomplete data via the EM algorithm. — doi:10.2307/2984875.
  42. C. Fraley, A. E. Raftery. How Many Clusters? Which Clustering Method? Answers Via Model-Based Cluster Analysis (англ.). — doi:10.1093/comjnl/41.8.578.
  43. Chris Fraley, Adrian E. Raftery. MCLUST: Software for Model-Based Cluster Analysis (англ.). — doi:10.1007/s003579900058.
  44. 1 2 Kyung Kim, Richard Simon. Using single cell sequencing data to model the evolutionary history of a tumor (англ.). — doi:10.1186/1471-2105-15-27.
  45. Ester Falconer, Mark Hills, Ulrike Naumann, Steven S S Poon, Elizabeth A Chavez. DNA template strand sequencing of single-cells maps genomic rearrangements at high resolution. — doi:10.1038/nmeth.2206.
  46. Ester Falconer, Peter M. Lansdorp. Strand-seq: A unifying tool for studies of chromosome segregation. — doi:10.1016/j.semcdb.2013.04.005.
  47. Paul Coupland, Tamir Chandra, Mike Quail, Wolf Reik, Harold Swerdlow. Direct sequencing of small genomes on the Pacific Biosciences RS without library preparation. — doi:10.2144/000113962.
  48. Nady El Hajj, Tom Trapphoff, Matthias Linke, Andreas May, Tamara Hansmann. Limiting dilution bisulfite (pyro)sequencing reveals parent-specific methylation patterns in single early mouse embryos and bovine oocytes. — doi:10.4161/epi.6.10.17202.
  49. Hongshan Guo, Ping Zhu, Xinglong Wu, Xianlong Li, Lu Wen. Single-cell methylome landscapes of mouse embryonic stem cells and early embryos analyzed using reduced representation bisulfite sequencing (англ.). — doi:10.1101/gr.161679.113.
  50. Takashi Nagano, Yaniv Lubling, Eitan Yaffe, Steven W Wingett, Wendy Dean. Single-cell Hi-C for genome-wide detection of chromatin interactions that occur simultaneously in a single cell. — doi:10.1038/nprot.2015.127.
  51. 1 2 3 Iain C. Macaulay, Thierry Voet. Single Cell Genomics: Advances and Future Perspectives. — doi:10.1371/journal.pgen.1004126.