Метагеномика

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Метагеномика позволяет изучать сообщества микроорганизмов, например, в струях кислоты, использующихся в горной добыче.

Метагено́мика — это раздел молекулярной генетики, в котором изучается генетический материал, полученный из образцов окружающей среды. Метагеномика изучает набор генов всех микроорганизмов, находящихся в образце среды, - метагеном. Метагеномный анализ позволяет определить видовое разнообразие исследуемого образца без необходимости выделения и культивирования микроорганизмов.

Основным преимуществом использования метагеномного подхода является учет не только культивируемых микроорганизмов, но и некультивируемых. Оказалось, что такие организмы вносят основной вклад в видовое разнообразие сообществ.[1] Метагеномика позволяет детально изучить разнообразие сообществ, а значит и выяснить механизмы их функционирования, определить метаболические взаимосвязи.[2]

Широкое развитие метагеномики обусловлено распространением методов секвенирования нового поколения. Они позволяют получить последовательности практически всех генов каждого микроорганизма сообщества.[3]  И так как цена на секвенирование ДНК падает с каждым днём, такой анализ становится всё более доступным.

История[править | править вики-текст]

Происхождение термина[править | править вики-текст]

Термин метагеномика был впервые использован в 1998 году.[4] Термин метагеном подразумевал возможность использовать набор генов найденных в образцах среды как геном одного организма для воссоздания функциональных свойств некой среды, уподобляя её единому организму. Лавинообразный интерес к генетике окружающей среды в следующие несколько лет привел к использованию этого термина при описании любого акта секвенирования образцов окружающей среды.

История проектов[править | править вики-текст]

Несколько проектов метагеномики человека находятся на разных стадиях выполнения или уже завершены, в том числе анализ микрофлоры кожи и кишечника[5]. Получение полной бактериальной картины организма требует затраты огромных усилий, что обусловлено огромным видовым разнообразием микроорганизмов.

В 2007—2008 годах был запущен глобальный проект, получившего название «Микробиом человека (англ.)». В 2011 году были представлены некоторые результаты[6][7]

Русский метагеном[править | править вики-текст]

С 2010 года масштабное исследование метагенома человека наметилось и в России. Консорциум ведущих Российских институтов в области гастроэнтерологии и молекулярной биологии в качестве инициативного проекта начал проводить первые эксперименты по широкомасштабному секвенированию образцов ДНК из кишечника человека[8].

Сферы метагеномики[править | править вики-текст]

Методы метагеномики применяются для проведения анализа генома микробных популяций. На сегодняшний день можно выделить две области:

  • Метагеномика окружающей среды — изучающая метагеномы биогеоценозов — озер, морей, болот, почвы и прочее. Здесь основной интерес ученых лежит в исследовании синергии действия множества микроорганизмов для получения конкретных результатов, например, очистка воды или утилизация отходов.
  • Метагеномика организма человека — сравнение бактериальных сообществ организмов людей разного возраста, происхождения и состояния здоровья позволит установить, каким образом микроорганизмы предотвращают или повышают риск развития определенных заболеваний, а также возможные методы управления этими механизмами.

Секвенирование[править | править вики-текст]

Секвенирование ДНК из образца среды по методу "дробовика" (A) Получение образцов окружающей среды; (B) Фильтрование частиц по размеры; (C) Лизис клеток и экстрагировани ДНК; (D) Клонирование и создание библиотеки клонов; (E) Секвенирование; (F) Сборка в контиги и скаффолды

Cеквенирование с использованием случайного фрагментирования[править | править вики-текст]

Первый широко используемый метод секвенирования путём случайного фрагментирования – это метод дробовика. Он заключается в том, что ДНК, выделенная из образца, гидролизуется на случайные фрагменты. Затем методами молекулярного клонирования из полученных фрагментов создается библиотека клонов. Последовательности ДНК определяют методом секвенирования по Сэнгеру, выравнивают эти последовательности и определяют места перекрывания для получения более длинных фрагментов. Для того, чтобы обеспечить наличие участков перекрывания, стадии фрагментации и секвенирования повторяют несколько раз.[9]

Наличие в методе стадии молекулярного клонирования делает его достаточно трудоёмким. Кроме того, на 2016 год секвенирование по Сенгеру уже не применяется для определения последовательностей геномов. С другой стороны методы секвенирования нового поколения позволяют получить последовательности геномов организмов, находящихся в образце среды, быстрее и без стадии молекулярного клонирования.[10],[11]

В результате секвенирования получается набор генов, которые присутствуют в организмах, представленных в образце. Функциональное описание продуктов этих генов позволяет определить метаболические взаимосвязи в сообществе.[12]

При таком анализе в наборе ДНК из образца будут преобладать гены наиболее представленных организмов. Для того, чтобы обеспечить достаточное покрытие геномов мало-представленных организмов, возникает необходимость использования больших объемов образца среды. С другой стороны, случайный характер методов севкенирования (случайное фрагментирование последовательности ДНК из образца) приводит к тому, что последовательности многих организмов, которые могли бы остаться незамеченными при использовании традиционных методов культивирования, будут доступны для анализа. По крайней мере, в виде некоторых небольших участков последовательности их геномной ДНК.[13]

Секвенирование эволюционно консервативных генов[править | править вики-текст]

Задача определения видового состава сообщества решается с помощью секвенирования определенных генов, которые должны быть у всех организмов в сообществе. Некоторые участки таких последовательностей геномной ДНК, как например ген, кодирующий 16S рРНК, состоят из высококонсервативных последовательностей и гипервариабельных участков.[14] Эта особенность позволяет использовать праймеры для секвенирования, которые комплементарны консервативным участкам для получения последовательностей гипервариабельных участков. Полученные последовательности позволяют отнести организм к тому или иному виду. Использование праймеров необходимо для секвенирования по Сэнгеру, тогда как методы секвенирования нового поколения определяют последовательности, полученные после фрагментации ДНК из образца и амплификации. Определение видовой принадлежности в этом случае также осуществляется с помощью таких генов как ген 16S рРНК.[15]

Биоинформатический анализ[править | править вики-текст]

Данные, полученные в результате метагеномного эксперимента, содержат огромное количество информации и шума, так как они представляют из себя фрагменты последовательностей ДНК, принадлежащих тысячам и десяткам тысяч разных видов.[16] Например, в результате секвенирования метагенома рубца коровы получается 279 миллиардов пар нуклеотидов[17], а метагеном кишечника человека состоит из 3,3 миллиона генов, собранных из 567,7 миллиардов пар нуклеотидов.[18] Сбор, курирование и извлечение полезной биологической информации из наборов данных такого размера определяют основные вычислительные задачи для биоинформатики.[19]

Предварительная обработка данных[править | править вики-текст]

Первый этап метагеномного анализа заключается в предварительной фильтрации данных. Он включает удаление избыточных и некачественных последовательностей. Для метагеномов, полученных из организмов животных, важно удаление последовательностей эукариотического происхождения. [20] Удаление загрязнений эукариотической геномной ДНК производится с помощью алгоритмов Eu-Detect[21] и DeConseq[22].

Сборка последовательностей[править | править вики-текст]

По своей сути последовательности ДНК из геномных и метагеномных экспериментов одинаковые. Тем не менее метагеномные эксперименты обеспечивают более низкое покрытие, а использование для анализа методов секвенирования нового поколения приводит к ограничению на длину секвенируемой последовательности.[19] Также задача усложняется из-за разной представленности видов в сообществе. Эти особенности приводят к тому, что сборка участков генома из данных метагеномного эксперимента становится сложной задачей, она требует высоких вычислительных мощностей и может приводить к ошибочному результату. Например, могут получиться химерные последовательности, которые представляют из себя комбинацию участков последовательностей ДНК разных организмов.[23]

Существует несколько программ, которые производят сборку с учетом парно-концевых чтений, этот метод позволяет уменьшить число ошибок. Такие программы как Phrap или Celera Assembler изначально были созданы для сборки единичных геномов, однако они дают неплохие результаты при обработке метагеномных данных.[16] Другие программы, например Velvet assembler, используют графы де Брейна для того, чтобы справляться с короткими последовательностями (ридами), которые получаются в результате работы методов секвенирования нового поколения. Сборку геномов наиболее распространенных видов облегчает использование референсных геномов.[24] После сборки возникает следующая проблема, необходимо определить каким видам принадлежат полученные последовательности.[25]

Поиск кодирующих последовательностей[править | править вики-текст]

В метагеномном анализе для аннотации кодирующих последовательностей после сборки, используются два основных подхода.[24] В основе первого метода лежит поиск гомологичных аннотированных генов обычно с помощью BLAST. Такой подход реализован в программе MEGAN4.[26] Второй подход (ab initio) использует внутренние особенности последовательности для предсказания кодирующих областей, для его реализации используются обучающие выборки генов родственных организмов.[27] Этот подход используют программы GeneMark[28] и GLIMMER[29]. Основное преимущество подхода ab initio состоит в том, что он может определить кодирующие последовательности, для которых неизвестны гомологи.[16]

Определение видового состава[править | править вики-текст]

В то время как аннотация метагенома указывает на то, какие функции реализуются в сообществе, определение видового состава позволяет определить какие организмы ответственны за их выполнение. Процесс соотнесения определенных генов, а значит и функций, которые они могут выполнять, с определенными видами организмов называется биннинг. Он реализуется с помощью метода BLAST через поиск похожих генов, для которых известно, какому организму они принадлежат. Этот подход реализован в программе MEGAN (MEta Genome ANalyzer).[30]  Также эта программа позволяет провести функциональную аннотацию метагенома. В процессе обработки последовательности ассоциируются с узлами таксономии NCBI и с узлами функциональных классификаций SEED или KEGG[31] с помощью алгоритма наименьшего общего предка.[31] Первая версия программы была использована в 2005 году для анализа метагеномного контекста последовательностей ДНК, полученных из кости мамонта.[32]

Другая программа PhymmBL использует в этих целях интерполированные Марковские модели.[16] Методы MetaPhlAn[33] и AMPHORA[34] используют данные об уникальных генетических маркерах – последовательностях, характерных для какой-либо одной клады, для определения представленности таксономической группы в сообществе.[35] Некоторые методы биннинга используют информацию внутренних свойствах последовательности, таких как частоты встречаемости олигонуклеотидов или использование кодонов.

Интеграция данных[править | править вики-текст]

Анализ большого экспоненциально растущего количества доступных последовательностей ДНК является сложной задачей. Более того, он осложняется наличием метаданных, связанных с метагеномными проектами. Они включают в себя информацию о географии исследуемого образца, особенностях окружающей среды, физические данные, а также методику отбора проб.[19] Эта информация необходима для обеспечения воспроизводимости экспериментов и для дальнейшего анализа. Важно представление этой информации с использованием стандартизированных форматов данных и развитие специализированных баз данных, таких как Genomes OnLine Database (GOLD).[36]

Для интеграции метаданных и данных о геномных последовательностях разработаны специальные сервисы. В 2007 году был создан доступный сервис для анализа данных метагеномных экспериментов Metagenomics Rapid Annotation с использованием Subsystem Technology server (MG-RAST). К 2012 году в эту базу данных было загружено около 50000 метагеномов.[37]

Сравнительная метагеномика[править | править вики-текст]

Сравнительный анализ метагеномов позволяет разобраться в особенностях функционирования микробиологических сообществ и, для симбиотических микроорганизмов, установить их роль в поддержании здоровья хозяина.[38]  Парные и множественные сравнения метагеномов выполняются с помощью выравнивания их фрагментов, сравнения GC-состава, паттернов использования олигонуклеотидов, видового разнообразия. Функциональное сравнение может быть сделано через сравнение фрагментов метагеномов с базами данных, содержащих информацию о метаболических путях.[31] Для определения функции сообщества важную роль играет не определение видового состава, а именно функциональное описание всех генов, присутствующих в нем. Стоит отметить, что одинаковые функции обнаруживаются в сообществах, находящихся в сходных экологических условиях, хотя видовой состав таких сообществ может сильно отличаться.[39] Именно поэтому метаданные, описывающие условия получения метагеномного образца, очень важны для сравнительно анализа.[16]

Основная цель сравнительной метагеномики заключается в определении групп микроорганизмов, которые определяют характеристики конкретного участка окружающей среды. Эти характеристики являются результатом взаимодействий групп микроорганизмов. С этой целью была разработана программа Community-Analyzer.[40] Она позволяет сравнить таксономический состав сообществ и выявить возможные взаимодействия между обнаруженными группами микроорганизмов. Вместо простого сравнения распространения таксономических групп программа учитывает вероятностные паттерны взаимодействий.

Метагеном человека[править | править вики-текст]

Специалисты до сих пор не пришли к единому мнению о конечных целях этого проекта. Существуют предложения детального исследования геномов преобладающих бактерий, другое направление — анализирование вариаций бактериальных сообществ.

Основные центры, получившие финансирование на секвенирование геномов микроорганизмов кишечника, пригодных к культивированию в лабораторных условиях:

  • Бэйлорский университет (г. Уэйко, Техас, США);
  • Broad Institute (объединенный институт, в состав которого входят Массачусетский технологический институт, Гарвардский университет и институт Уайтхеда);
  • университет Вашингтона (г. Сент-Луис, штат Миссури).

Следует отметить, что стоимость секвенирования генома человека за последние три года уменьшилась почти в 100 раз и продолжает быстро снижаться. Совершенствование NGS технологий секвенирования ДНК в ближайшем будущем приведет к преодолению очередного ценового рубежа (1000$ за геном) и вызовет кардинальные перемены во многих областях биологии и медицинской генетики, что в дальнейшем должно привести к персонализации медицины. Технологический бум в данной области молекулярной генетики позволяет предположить, что постепенно метагеномика заменит ПЦР-диагностику.

В 2011 году в России также был объявлен грант на исследования в области метагеномики[41].

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Philip Hugenholtz, Brett M. Goebel, Norman R. Pace Impact of Culture-Independent Studies on the Emerging Phylogenetic View of Bacterial Diversity // Journal of Bacteriology. — 1998-09-01. — Т. 180, вып. 18. — С. 4765–4774. — ISSN 0021-9193.
  2. Marco, D. Metagenomics: Current Innovations and Future Trends. — Caister Academic Press. — 2011. — ISBN 978-1-904455-87-5.
  3. Jonathan A. Eisen Environmental shotgun sequencing: its potential and challenges for studying the hidden world of microbes // PLoS biology. — 2007-03-01. — Т. 5, вып. 3. — С. e82. — ISSN 1545-7885. — DOI:10.1371/journal.pbio.0050082.
  4. Handelsman, J; Rondon MR, Brady SF, Clardy J, Goodman RM (1998). «Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products». Chemistry & Biology 5: 245–249. DOI:10.1016/S1074-5521(98)90108-9..
  5. MetaHIT — перепись населения в желудочно-кишечном тракте — Deutsche Welle, 02.10.2009
  6. Консорциум Микробиом человека опубликовал результаты многолетней работы (14 июня 2012). Проверено 5 декабря 2013.
  7. Смита Мундасад. Ученые составили карту микробов в организме человека, Би-би-си (14 июня 2012). Проверено 5 декабря 2013.
  8. Проект русский Метагеном
  9. S. Anderson Shotgun DNA sequencing using cloned DNase I-generated fragments // Nucleic Acids Research. — 1981-07-10. — Т. 9, вып. 13. — С. 3015–3027. — ISSN 0305-1048.
  10. Alejandra Escobar-Zepeda, Arturo Vera-Ponce de León, Alejandro Sanchez-Flores The Road to Metagenomics: From Microbiology to DNA Sequencing Technologies and Bioinformatics // Frontiers in Genetics. — 2015-01-01. — Т. 6. — С. 348. — ISSN 1664-8021. — DOI:10.3389/fgene.2015.00348.
  11. Micah Hamady, Rob Knight Microbial community profiling for human microbiome projects: Tools, techniques, and challenges // Genome Research. — 2009-07-01. — Т. 19, вып. 7. — С. 1141–1152. — ISSN 1088-9051. — DOI:10.1101/gr.085464.108.
  12. Nicola Segata, Daniela Boernigen, Timothy L. Tickle, Xochitl C. Morgan, Wendy S. Garrett Computational meta'omics for microbial community studies // Molecular Systems Biology. — 2013-01-01. — Т. 9. — С. 666. — ISSN 1744-4292. — DOI:10.1038/msb.2013.22.
  13. Gene W. Tyson, Jarrod Chapman, Philip Hugenholtz, Eric E. Allen, Rachna J. Ram Community structure and metabolism through reconstruction of microbial genomes from the environment // Nature. — 2004-03-04. — Т. 428, вып. 6978. — С. 37–43. — ISSN 1476-4687. — DOI:10.1038/nature02340.
  14. K. M. McCabe, Y. H. Zhang, B. L. Huang, E. A. Wagar, E. R. McCabe Bacterial species identification after DNA amplification with a universal primer pair // Molecular Genetics and Metabolism. — 1999-03-01. — Т. 66, вып. 3. — С. 205–211. — ISSN 1096-7192. — DOI:10.1006/mgme.1998.2795.
  15. Douglas W Fadrosh, Bing Ma, Pawel Gajer, Naomi Sengamalay, Sandra Ott An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform // Microbiome. — 2014-02-24. — Т. 2. — С. 6. — ISSN 2049-2618. — DOI:10.1186/2049-2618-2-6.
  16. 1 2 3 4 5 John C. Wooley, Adam Godzik, Iddo Friedberg A primer on metagenomics // PLoS computational biology. — 2010-02-01. — Т. 6, вып. 2. — С. e1000667. — ISSN 1553-7358. — DOI:10.1371/journal.pcbi.1000667.
  17. Matthias Hess, Alexander Sczyrba, Rob Egan, Tae-Wan Kim, Harshal Chokhawala Metagenomic discovery of biomass-degrading genes and genomes from cow rumen // Science (New York, N.Y.). — 2011-01-28. — Т. 331, вып. 6016. — С. 463–467. — ISSN 1095-9203. — DOI:10.1126/science.1200387.
  18. Junjie Qin, Ruiqiang Li, Jeroen Raes, Manimozhiyan Arumugam, Kristoffer Solvsten Burgdorf A human gut microbial gene catalogue established by metagenomic sequencing // Nature. — 2010-03-04. — Т. 464, вып. 7285. — С. 59–65. — ISSN 1476-4687. — DOI:10.1038/nature08821.
  19. 1 2 3 National Research Council (US) Committee on Metagenomics: Challenges and Functional Applications. The New Science of Metagenomics: Revealing the Secrets of Our Microbial Planet. — Washington (DC): National Academies Press (US), 2007-01-01. — (The National Academies Collection: Reports funded by National Institutes of Health). — ISBN 9780309106764, 0309106761.
  20. Daniel R. Mende, Alison S. Waller, Shinichi Sunagawa, Aino I. Järvelin, Michelle M. Chan Assessment of metagenomic assembly using simulated next generation sequencing data // PloS One. — 2012-01-01. — Т. 7, вып. 2. — С. e31386. — ISSN 1932-6203. — DOI:10.1371/journal.pone.0031386.
  21. Monzoorul Haque Mohammed, Sudha Chadaram, Dinakar Komanduri, Tarini Shankar Ghosh, Sharmila S. Mande Eu-Detect: an algorithm for detecting eukaryotic sequences in metagenomic data sets // Journal of Biosciences. — 2011-09-01. — Т. 36, вып. 4. — С. 709–717. — ISSN 0973-7138.
  22. Robert Schmieder, Robert Edwards Fast Identification and Removal of Sequence Contamination from Genomic and Metagenomic Datasets // PLoS ONE. — 2011-03-09. — Т. 6, вып. 3. — ISSN 1932-6203. — DOI:10.1371/journal.pone.0017288.
  23. Victor Kunin, Alex Copeland, Alla Lapidus, Konstantinos Mavromatis, Philip Hugenholtz A bioinformatician's guide to metagenomics // Microbiology and molecular biology reviews: MMBR. — 2008-12-01. — Т. 72, вып. 4. — С. 557–578, Table of Contents. — ISSN 1098-5557. — DOI:10.1128/MMBR.00009-08.
  24. 1 2 Victor Kunin, Alex Copeland, Alla Lapidus, Konstantinos Mavromatis, Philip Hugenholtz A bioinformatician's guide to metagenomics // Microbiology and molecular biology reviews: MMBR. — 2008-12-01. — Т. 72, вып. 4. — С. 557–578, Table of Contents. — ISSN 1098-5557. — DOI:10.1128/MMBR.00009-08.
  25. Joshua N. Burton, Ivan Liachko, Maitreya J. Dunham, Jay Shendure Species-Level Deconvolution of Metagenome Assemblies with Hi-C–Based Contact Probability Maps (англ.) // G3: Genes|Genomes|Genetics. — 2014-07-01. — Vol. 4, fasc. 7. — P. 1339–1346. — ISSN 2160-1836. — DOI:10.1534/g3.114.011825.
  26. Daniel H. Huson, Suparna Mitra, Hans-Joachim Ruscheweyh, Nico Weber, Stephan C. Schuster Integrative analysis of environmental sequences using MEGAN4 // Genome Research. — 2011-09-01. — Т. 21, вып. 9. — С. 1552–1560. — ISSN 1549-5469. — DOI:10.1101/gr.120618.111.
  27. Wenhan Zhu, Alexandre Lomsadze, Mark Borodovsky Ab initio gene identification in metagenomic sequences // Nucleic Acids Research. — 2010-07-01. — Т. 38, вып. 12. — С. e132. — ISSN 1362-4962. — DOI:10.1093/nar/gkq275.
  28. John Besemer, Mark Borodovsky GeneMark: web software for gene finding in prokaryotes, eukaryotes and viruses // Nucleic Acids Research. — 2005-07-01. — Т. 33, вып. Web Server issue. — С. W451–454. — ISSN 1362-4962. — DOI:10.1093/nar/gki487.
  29. Gautam Aggarwal, Ramakrishna Ramaswamy Ab initio gene identification: prokaryote genome annotation with GeneScan and GLIMMER // Journal of Biosciences. — 2002-02-01. — Т. 27, вып. 1 Suppl 1. — С. 7–14. — ISSN 0250-5991.
  30. Daniel H. Huson, Alexander F. Auch, Ji Qi, Stephan C. Schuster MEGAN analysis of metagenomic data // Genome Research. — 2007-03-01. — Т. 17, вып. 3. — С. 377–386. — ISSN 1088-9051. — DOI:10.1101/gr.5969107.
  31. 1 2 3 Suparna Mitra, Paul Rupek, Daniel C. Richter, Tim Urich, Jack A. Gilbert Functional analysis of metagenomes and metatranscriptomes using SEED and KEGG // BMC bioinformatics. — 2011-01-01. — Т. 12 Suppl 1. — С. S21. — ISSN 1471-2105. — DOI:10.1186/1471-2105-12-S1-S21.
  32. Hendrik N. Poinar, Carsten Schwarz, Ji Qi, Beth Shapiro, Ross D. E. Macphee Metagenomics to paleogenomics: large-scale sequencing of mammoth DNA // Science (New York, N.Y.). — 2006-01-20. — Т. 311, вып. 5759. — С. 392–394. — ISSN 1095-9203. — DOI:10.1126/science.1123360.
  33. MetaPhlAn: Metagenomic Phylogenetic Analysis | The Huttenhower Lab. huttenhower.sph.harvard.edu. Проверено 1 мая 2016.
  34. Csaba Kerepesi, Dániel Bánky, Vince Grolmusz AmphoraNet: the webserver implementation of the AMPHORA2 metagenomic workflow suite // Gene. — 2014-01-10. — Т. 533, вып. 2. — С. 538–540. — ISSN 1879-0038. — DOI:10.1016/j.gene.2013.10.015.
  35. Nicola Segata, Levi Waldron, Annalisa Ballarini, Vagheesh Narasimhan, Olivier Jousson Metagenomic microbial community profiling using unique clade-specific marker genes // Nature Methods. — 2012-08-01. — Т. 9, вып. 8. — С. 811–814. — ISSN 1548-7105. — DOI:10.1038/nmeth.2066.
  36. Ioanna Pagani, Konstantinos Liolios, Jakob Jansson, I.-Min A. Chen, Tatyana Smirnova The Genomes OnLine Database (GOLD) v.4: status of genomic and metagenomic projects and their associated metadata // Nucleic Acids Research. — 2012-01-01. — Т. 40, вып. Database issue. — С. D571–579. — ISSN 1362-4962. — DOI:10.1093/nar/gkr1100.
  37. F. Meyer, D. Paarmann, M. D'Souza, R. Olson, E. M. Glass The metagenomics RAST server - a public resource for the automatic phylogenetic and functional analysis of metagenomes // BMC bioinformatics. — 2008-01-01. — Т. 9. — С. 386. — ISSN 1471-2105. — DOI:10.1186/1471-2105-9-386.
  38. Ken Kurokawa, Takehiko Itoh, Tomomi Kuwahara, Kenshiro Oshima, Hidehiro Toh Comparative metagenomics revealed commonly enriched gene sets in human gut microbiomes // DNA research: an international journal for rapid publication of reports on genes and genomes. — 2007-08-31. — Т. 14, вып. 4. — С. 169–181. — ISSN 1340-2838. — DOI:10.1093/dnares/dsm018.
  39. Carola Simon, Rolf Daniel Metagenomic analyses: past and future trends // Applied and Environmental Microbiology. — 2011-02-01. — Т. 77, вып. 4. — С. 1153–1161. — ISSN 1098-5336. — DOI:10.1128/AEM.02345-10.
  40. Bhusan K. Kuntal, Tarini Shankar Ghosh, Sharmila S Mande Community-Analyzer: A platform for visualizing and comparing microbial community structure across microbiomes // Genomics. — 2013-10-01. — Т. 102, вып. 4. — С. 409–418. — DOI:10.1016/j.ygeno.2013.08.004.
  41. Лот МОН РФ по метагеномике