Полногеномный поиск ассоциаций

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Манхэттенский график, изображающий некоторые тесно связанные локусы риска. Каждая точка представляет собой однонуклеотидный полиморфизм, расположение которого в геноме показано на оси Х, а P-значение на оси Y. Данный пример был взят из исследований полногеномных ассоциаций для нарушений микроциркуляций.[1]

Полногеномный поиск ассоциаций — направление биологических (как правило, биомедицинских) исследований, связанных с исследованием ассоциаций между геномными вариантами и фенотипическими признаками. Часто под полногеномным поиском ассоциаций подразумевают только поиск связей между однонуклеотидными полиморфизмами и заболеваниями человека.

Основная цель полногеномного поиска ассоциаций заключается в идентификации генетических факторов риска, чтобы дать обоснованный прогноз о предрасположенности к заболевания, а также выявления биологических основ восприимчивости к болезни для разработки новых стратегий профилактики и лечения.[2]

В исследованиях такого типа обычно сравнивают геномы группы больных людей с геномами контрольной группы, включающей в себя аналогичных по возрасту, полу и другим признакам здоровых людей. Материалом для исследования являются образцы ДНК каждого участника исследования. Если удается выявить варианты геномов (точнее, совокупность аллелей), которые значимо чаще встречаются у людей с данным заболеванием, то говорят, что такой вариант связан, или ассоциирован, с болезнью. В отличие от методов, которые проверяют один или несколько конкретных участков генома, полногеномный поиск ассоциаций использует полную последовательность ДНК. Следует отметить, что этот подход к исследованиям не выявляет мутации, ставшие причиной заболевания, а только более или менее значительную корреляцию с заболеванием или другим признаком.

Вторая по важности область применения полногеномного анализа ассоциаций — фармакогенетика, то есть поиск аллелей, связанных с метаболизмом лекарственных препаратов и их побочными эффектами.[2]

Первые успешные исследования полногеномных ассоциаций были проведены на больных макулодистрофией и опубликованы в 2005 году. Были обнаружены два аутосомных однонуклеотидных полиморфизма.[3] К 2011 году были протестированы сотни тысяч людей, было проведено более 1200 исследований полногеномных ассоциаций для 200 заболеваний и фенотипических проявлений, в результате было найдено около 4000 однонуклеотидных полиморфизмов.[4] Ряд исследований полногеномных ассоциаций был раскритикован за пренебрежение контролем качества. В целом методология до сих пор является предметом для споров.

Предпосылки[править | править вики-текст]

Исследования полногеномных ассоциаций, как правило, применяются по отношению к распространенным генетическим вариантам со слабым эффектом (справа внизу).

Геномы двух любых людей имеют огромное число различий. Это могут быть как однонуклеотидные полиморфизмы, так и более крупные изменения: делеции, вставки и изменения копийности генов. Любое из этих различий может отвечать за отдельные характерные особенности индивидуума, например, цвет глаз, волос,[5] или стать причиной заболевания. До появления методов для полногеномного поиска ассоциаций, исследования основывались на анализе сцепленного наследования в семьях. Этот подход оказался весьма эффективным для выявления генов, ответственных за заболевания с простым менделеевским наследованием, таких как муковисцидоз. Тем не менее, подобные генетические исследования оказались малоэффективными для выявления причин более сложных заболеваний.[6] В качестве альтернативы для этого метода был предложен полногеномный поиск ассоциаций. Этот тип исследований основан на анализе частоты аллелей различных генов среди индивидуумов. Если при сравнении те или иные аллели генов встречаются у людей с исследуемым фенотипом (например, у носителей болезни) значимо чаще, чем в других, то есть основания предполагать, что именно эти аллели ответственны за проявление этого фенотипа. Исследования мощности статистических тестов, применяемых для полногеномного поиска ассоциаций показывали, что этот способ лучше, чем другие, такие как исследование сцепления, подходят для обнаружения слабых генетических эффектов.

Некоторые дополнительные факторы оказали влияние на развитие исследований по поиску полногеномных ассоциаций. Одним из них стало появление биобанков, представляющих собой хранилища человеческого генетического материала, что облегчало сбор биологических образцов для исследований.[7] Другим таким фактором оказался международный проект HapMap, являющийся каталогом однонуклеотидных полиморфизмов.[8]

Методы[править | править вики-текст]

В основе поиска полногеномных ассоциаций как правило лежит сравнение геномов двух групп людей: носителей исследуемого фенотипа (заболевания) и контрольной группы. Для всех индивидуумов производится генотипирование для большинства известных однонуклеотидных полиморфизмов (SNP). Далее, для каждого SNP проверяется, насколько значимы различия в распределении частот аллелей между исследуемой и контрольной группой.

Альтернативой делению на две группы в полногеномных исследованиях является количественный анализ фенотипа, например, рост, концентрация биомаркера или экспрессия гена. Кроме того, могут быть использованы данные о пенетрантности исследуемых аллелей.

Полногеномный анализ ассоциаций часто учитывает несколько переменных сразу. Это может как исказить, так и прояснить результаты, так как эти переменные могут быть связаны сами по себе, без влияния исследуемого феномена. Такими переменными являются, например, возраст и пол. Более того, многие вариации генома связаны с ареалом и историей распространения изначальной мутации, поэтому участники таких исследований всегда заполняют данные об этнический принадлежности и истории миграций своей семьи.

Такие исследования часто графически представляют в виде «манхеттенского графика». В контексте полногеномного поиска ассоциаций, на графике показывают отрицательный логарифм P-значения в зависимости от геномного локуса. Таким образом, SNP/CNV с наиболее значимой ассоциацией будет выделяться на участке, как правило, в виде стопки из нескольких близлежащих точек-SNP, отражающих структуру гаплотипа. Важно отметить, что порог P-значения должен подвергаться поправке на множественное тестирование. Точный порог варьируется в зависимости от исследования, но, как правило, P-значения должно быть очень низким (10 в степени −7 или −8).

Результаты[править | править вики-текст]

Предпринимаются попытки создать всеобъемлющие каталоги однонуклеотидных полиморфизмов, связанных с различными признаками. На конец 2011 года, более двух тысяч SNP ассоциировано с заболеваниями. В большинстве случаев, эта ассоциация была выявлена совсем недавно. Количество найденных локусов сильно варьирует в зависимости от заболевания: от нескольких в случае психиатрических заболеваний, до ста и более в случае воспалительных кишечных заболеваний, например, болезни Крона или язвенного колита[9].

В первом исследовании по полногеномному поиску ассоциаций, проведенном в 2005 году, исследовалась возрастная макулярная дегенерация. В исследовании приняло участие 96 больных и 50 здоровых людей. Было обнаружено два однонуклеотидных полиморфизма со значимым различием частот в двух группах. Эти полиморфизмы были расположены в гене фактора H системы комплемента. Это исследование подстегнуло дальнейшие терапевтические исследования, направленное на этот белок.[2].

Другая важная веха в истории полногеномного поиска ассоциаций — исследования случай-контроль консорциумом Wellcome Trust. На момент публикации (2007 год) это было крупнейшее исследование такого типа. Выборка насчитывала 14000 случаев распространенных общих заболеваний по 2000 случаев каждого: ишемическая болезнь сердца, сахарный диабет 1 типа, сахарный диабет 2 типа, ревматоидный артрит, болезнь Крона, биполярное расстройство и артериальная гипертензия. Размер контрольной группы составлял 3000 человек. Было выявлено 500 тысяч генетических вариаций и 10 генов, обуславливающих предрасположенность к этим заболеваниям.

В исследовании генетических вариантов, обуславливающих приспособленность тибетцев к высокогорным условиям, было выявлено два белка EPAS1 и EGLN1, связанных с транскрипционным фактором HIF-α, индуцируемым гипоксией. Исследование было проведено на 46 тибетцах и 92 ханьцах.[10] Один из двух белков, обнаруженных в этом исследовании, мог быть открыт раньше, если бы авторы более ранней работы по этой теме[11] аккуратно провели статистическую обработку. Правильный анализ и интерпретация данных — одна из главных проблем полногеномного поиска ассоциаций, и обработки других массовых биологических данных.

Важный результат полногеномного поиска ассоциаций связан с исследованием дозировки варфарина[2]. Исследования такого типа являются первыми проявлениями персонализированной медицины.

Клинические приложения[править | править вики-текст]

Одной из проблем является применение полногеномного поиска ассоциаций в разработке лекарств и развитии диагностики.[12] Были проведены некоторые исследования применения маркерных однонуклеотидных полиморфизмов для повышения точности прогноза заболеваний, но значимость этого применения остается предметом для спора.[13][14] В целом, проблемой такого подхода является слабый наблюдаемый эффект, что практически не способствует повышению точности прогноза. Тем не менее данный подход нашел успешное применение в патофизиологии.[15] Одним из примеров этого является идентификация генетического варианта, ассоциированного с ответом на лечение гепатита С. Было показано, что лечение гепатита С генотипа 1 с помощью пэгилированного интерферона альфа-2а или пэгилированного интерферона альфа-2b, комбинированного с рибавирином, вызывает разные ответные реакции, ассоциированные с однонуклеотидными полиморфизмами рядом с человеческим геном, кодирующим интерлейкин 28B (интерферон лямбда 3).[16] Также было продемонстрировано, что те же самые генетические варианты ответственны за спонтанное самоизлечение от вируса гепатита С генотипа 1.[17]

Ограничения[править | править вики-текст]

Существуют некоторые проблемы и ограничения, связанные с полногеномным поиском ассоциаций, и используемые в связи с этим методы контроля качества и дизайна исследований. Отсутствие четко определенных тестовой и контрольной выборок, недостаточный объем выборки, необходимость контроля на множественные испытания и контроля стратификации населения являются основными сложностями.[18] В связи с этим было отмечено, что "подход полногеномного поиска ассоциаций может быть проблематичным, потому что огромное количество статистических тестов дают беспрецедентную возможность ложно-положительных результатов ".[18]

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Ikram MK, Sim X, Xueling S, et al. (October 2010). «Four novel Loci (19q13, 6q24, 12q24, and 5q14) influence the microcirculation in vivo». PLoS Genet. 6 (10): e1001184. DOI:10.1371/journal.pgen.1001184. PMID 21060863.
  2. 1 2 3 4 Bush WS, Moore JH (2012). «Chapter 11: genome-wide association studies». PLoS Comput Biol 8 (12): e1002822. DOI:10.1371/journal.pcbi.1002822. PMID 23300413.
  3. Klein RJ, Zeiss C, Chew EY, Tsai JY, Sackler RS, Haynes C, Henning AK, SanGiovanni JP, Mane SM, Mayne ST, Bracken MB, Ferris FL, Ott J, Barnstable C, Hoh J (April 2005). «Complement Factor H Polymorphism in Age-Related Macular Degeneration». Science 308 (5720): 385–9. DOI:10.1126/science.1109557. PMID 15761122.
  4. Johnson AD, O'Donnell CJ (2009). «An Open Access Database of Genome-wide Association Results». BMC Med. Genet. 10: 6. DOI:10.1186/1471-2350-10-6. PMID 19161620.
  5. Sulem, Patrick and Gudbjartsson, Daniel F and Stacey, Simon N and Helgason, Agnar and Rafnar, Thorunn and Magnusson, Kristinn P and Manolescu, Andrei and Karason, Ari and Palsson, Arnar and Thorleifsson, Gudmar and others (2007). «Genetic determinants of hair, eye and skin pigmentation in Europeans». Nature genetics 39 (12): 1443--1452. DOI:10.1038/ng.2007.13. PMID 17952075.
  6. Altmüller J, Palmer LJ, Fischer G, Scherb H, Wjst M (November 2001). «Genomewide Scans of Complex Human Diseases: True Linkage Is Hard to Find». Am. J. Hum. Genet. 69 (5): 936–50. DOI:10.1086/324069. PMID 11565063.
  7. Greely HT (2007). «The uneasy ethical and legal underpinnings of large-scale genomic biobanks». Annu Rev Genomics Hum Genet 8: 343–64. DOI:10.1146/annurev.genom.7.080505.115721. PMID 17550341.
  8. The International HapMap Project, Gibbs RA, Belmont JW, Hardenbol P, Willis TD, Yu F, Yang H, Ch'Ang L-Y, Huang W (December 2003). «The International HapMap Project». Nature 426 (6968): 789–96. DOI:10.1038/nature02168. PMID 14685227.
  9. Visscher, Peter M and Brown, Matthew A and McCarthy, Mark I and Yang, Jian (2012). «Five years of GWAS discovery». The American Journal of Human Genetics 90: 7--24. DOI:10.1016/j.ajhg.2011.11.029. PMID 22243964.
  10. Shuhua Xu, Shilin Li, Yajun Yang, Jingze Tan, Haiyi Lou, Wenfei Jin, Ling Yang, Xuedong Pan, Jiucun Wang, Yiping Shen, Bailin Wu, Hongyan Wang, and Li Jin A Genome-Wide Search for Signals of High-Altitude Adaptation in Tibetans Mol Biol Evol (2011) 28(2): 1003—1011 first published online October 20, 2010 doi:10.1093/molbev/msq277
  11. Simonson TS, Yang Y, Huff CD, et al.; (12 co-authors). Genetic Evidence for high-altitude adaptation in Tibet. Science 2010;329:72-75.
  12. Iadonato SP, Katze MG (September 2009). «Genomics: Hepatitis C virus gets personal». Nature 461 (7262): 357–8. DOI:10.1038/461357a. PMID 19759611.Шаблон:Closed access
  13. Muehlschlegel JD, Liu KY, Perry TE, Fox AA, Collard CD, Shernan SK, Body SC (September 2010). «Chromosome 9p21 Variant Predicts Mortality after CABG Surgery». Circulation 122 (11 Suppl): S60–5. DOI:10.1161/CIRCULATIONAHA.109.924233. PMID 20837927.
  14. Paynter NP, Chasman DI, Paré G, Buring JE, Cook NR, Miletich JP, Ridker PM (February 2010). «Association between a Literature-Based Genetic Risk Score and Cardiovascular Events in 19,313 Women». JAMA 303 (7): 631–7. DOI:10.1001/jama.2010.119. PMID 20159871.
  15. Couzin-Frankel J (June 2010). «Major heart disease genes prove elusive». Science 328 (5983): 1220–1. DOI:10.1126/science.328.5983.1220. PMID 20522751.Шаблон:Closed access
  16. Ge D, Fellay J, Thompson AJ, Simon JS, Shianna KV, Urban TJ, Heinzen EL, Qiu P, Bertelsen AH, Muir AJ, Sulkowski M, McHutchison JG, Goldstein DB (September 2009). «Genetic variation in IL28B predicts hepatitis C treatment-induced viral clearance». Nature 461 (7262): 399–401. DOI:10.1038/nature08309. PMID 19684573.
  17. Thomas DL, Thio CL, Martin MP, Qi Y, Ge D, O'Huigin C, Kidd J, Kidd K, Khakoo SI, Alexander G, Goedert JJ, Kirk GD, Donfield SM, Rosen HR, Tobler LH, Busch MP, McHutchison JG, Goldstein DB, Carrington M (October 2009). «Genetic variation in IL28B and spontaneous clearance of hepatitis C virus». Nature 461 (7265): 798–801. DOI:10.1038/nature08463. PMID 19759533.
  18. 1 2 Pearson TA, Manolio TA (March 2008). «How to interpret a genome-wide association study». JAMA 299 (11): 1335–44. DOI:10.1001/jama.299.11.1335. PMID 18349094.

Ссылки[править | править вики-текст]