Вычислительная геномика

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Вычисли́тельная гено́мика использует вычислительный анализ, чтобы расшифровать последовательности генома и связанные с ними данные[1], включая последовательности ДНК и РНК. Также вычислительная геномика может быть определена как раздел биоинформатики, но с тем отличием, что внимание уделяется анализу полных геномов (а не отдельных генов), чтобы понять принципы того, как различные ДНК управляют организмом на молекулярном уровне[2].

История[править | править вики-текст]

Вычислительная геномика начала свое развитие одновременно с биоинформатикой. В 1960-х годах Маргарет Дейхофф и другие в Национальном Биомедицинском Исследовательский фонде создали базы данных различных последовательностей белков для эволюционного исследования [3]. В их исследовании строилось филогенетическое дерево, которое определило изменения, требующиеся для определенного белка, чтобы эволюционировать в другой белок. Это привело к созданию матрицы замен, которая оценивает вероятность связи одного белка с другим.

Начиная с 1980-х годов, стали появляться базы данных с геномными последовательностями, но при этом возникли новые проблемы при поиске и сравнении данных об отдельных генах. В отличие от алгоритмов поиска текстов, которые используются на веб-сайтах, при поиске генетического сходства необходимо выявлять последовательности, которые не обязательно идентичны, но и просто схожи. Это привело к появлению алгоритма Нидлмана — Вунша, который является алгоритмом динамического программирования для того, чтобы сравнить наборы последовательностей аминокислот друг с другом при использовании матриц замен, полученных в более раннем исследовании М.Дейхофф. Позже появился алгоритм BLAST, который позволяет осуществлять быстрый и оптимизированный поиск в базах данных последовательностей генов. BLAST и его модификации - одни из наиболее широко используемых алгоритмов для этой цели [4].

Появление фразы "вычислительная геномика" совпадает с появлением полных аннотированных геномов во второй половине 1990-х годов. Первая ежегодная конференции по вопросам вычислительной геномики была организована учеными из Института геномных исследований (TIGR) в 1998, обеспечивая форум для этой специальности и эффективно отличая эту область науки от более общих областей геномики или вычислительной биологии [5][6]. Впервые в научной литературе этот термин, согласно MEDLINE, был использован одним годом ранее (в журнале Nucleic Acids Research [7]).

Примечания[править | править вики-текст]

  1. Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
  2. Computational Genomics and Proteomics at MIT
  3. David Mount (2000), Bioinformatics, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
  4. T.A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
  5. [backPid]=67&cHash=fd69079f5e The 7th Annual Conference on Computational Genomics (2004)
  6. The 9th Annual Conference on Computational Genomics (2006)
  7. A. Wagner (1997), A computational genomics approach to the identification of gene networks, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048