Эта статья является кандидатом в добротные статьи

Анализ обогащения по функциональной принадлежности: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
→‎Обобщенный алгоритм GSEA {{cite doi|10.1186/1471-2105-10-47}}: оформление (иначе ничего не разглядеть)
Строка 1: Строка 1:
{{TOCright}}
{{TOCright}}
'''Ана́лиз обогащéния по функциона́льной принадлéжности'''<ref>{{Статья|автор= G. P. Sun, T. Jiang, P. F. Xie, J. Lan|заглавие=Идентификация генов, ассоциированных с периодонтитом, при помощи сетей коэкспресии|ссылка=http://molecbio.ru/downloads/mbm50/MBM50_1_0143.pdf|издание=Молекулярная биология|год=2016|том=50|выпуск=1|страницы=143—150|doi=10.7868/S0026898416010195}}</ref> ({{lang-en|gene set enrichment analysis, GSEA <ref>{{cite doi|10.1093/bib/bbr049}}</ref>}}) — совокупность методов для ассоциации набора [[ген]]ов с изменением [[фенотип]]а <ref>{{cite doi|10.1093/bib/bbr049}}</ref>. Для формализации существующих данных о фенотипе такие методы часто используют базы данных предварительно аннотированных наборов генов (например, термины проекта [[Gene ontology]] (GO): молекулярные функции, [[Биологический процесс|биологические процессы]] или клеточные компоненты <ref>{{cite doi|10.1002/ajmg.b.32328}}</ref>). Результатом применения метода (выдачей программы) в этом случае является множество преаннотированных наборов, частота встречаемости которых во входном наборе статистически значимо отличается от фоновой (например, частоты во всём геноме или в другом наборе генов). Такие преаннотированные наборы называют перепредставленными (если частота выше фоновой) или недопредставленными (если частота ниже фоновой).
'''Ана́лиз обогащéния по функциона́льной принадлéжности'''<ref>{{Статья|автор= G. P. Sun, T. Jiang, P. F. Xie, J. Lan|заглавие=Идентификация генов, ассоциированных с периодонтитом, при помощи сетей коэкспресии|ссылка=http://molecbio.ru/downloads/mbm50/MBM50_1_0143.pdf|издание=Молекулярная биология|год=2016|том=50|выпуск=1|страницы=143—150|doi=10.7868/S0026898416010195}}</ref> ({{lang-en|gene set enrichment analysis, GSEA <ref>{{cite doi|10.1093/bib/bbr049}}</ref>}}) — совокупность методов для ассоциации набора [[ген]]ов с изменением [[фенотип]]а <ref>{{cite doi|10.1093/bib/bbr049}}</ref>. Для формализации существующих данных о фенотипе такие методы часто используют базы данных предварительно аннотированных наборов генов (например, термины проекта [[Gene ontology]] (GO): молекулярные функции, [[Биологический процесс|биологические процессы]] или клеточные компоненты <ref>{{cite doi|10.1002/ajmg.b.32328}}</ref>). Результатом применения метода (выдачей программы) в этом случае является множество преаннотированных наборов, частота встречаемости которых во входном наборе статистически значимо отличается от фоновой (например, частоты во всём геноме или в другом наборе генов). Такие преаннотированные наборы называют перепредставленными (если частота выше фоновой) или недопредставленными (если частота ниже фоновой).

Данный подход был разработан в 2002-2003 годах независимо несколькими группами ученых и получил широкое распространение. Тогда же были предложены <ref>{{Статья|автор= Rhodes, D. R. & Chinnaiyan, A. M.|заглавие= Integrative analysis of the cancer transcriptome|ссылка= https://www.nature.com/articles/ng1570#ref26|издание= Nature Genetics|год= 2005|выпуск= 37|страницы= S31–S37|doi= 10.1038/ng1570}}</ref> первые программы для его реализации <ref>{{Статья|автор= Scott W Doniger, Nathan Salomonis, Kam D Dahlquist, Karen Vranizan, Steven C Lawlor and Bruce R Conklin|заглавие= MAPPFinder: using Gene Ontology and GenMAPP to create a global gene-expression profile from microarray data|ссылка= https://genomebiology.biomedcentral.com/articles/10.1186/gb-2003-4-1-r7 |издание= Genome Biol.|год= 2003|том= 4|выпуск= 1|страницы= R7|doi= 10.1186/gb-2003-4-1-r7}}</ref>, <ref>{{Статья|автор= Barry R Zeeberg, Weimin Feng, Geoffrey Wang, May D Wang, Anthony T Fojo, Margot Sunshine, Sudarshan Narasimhan, David W Kane, William C Reinhold, Samir Lababidi, Kimberly J Bussey, Joseph Riss, J Carl Barrett and John N Weinstein|заглавие= GoMiner: a resource for biological interpretation of genomic and proteomic data|ссылка= https://genomebiology.biomedcentral.com/articles/10.1186/gb-2003-4-4-r28 |издание= Genome Biol. |год= 2003|выпуск= 4|страницы= R28|doi= 10.1186/gb-2003-4-4-r28}}</ref>, <ref>{{Статья|автор= Vamsi K Mootha, Cecilia M Lindgren, Karl-Fredrik Eriksson, Aravind Subramanian, Smita Sihag, Joseph Lehar, Pere Puigserver, Emma Carlsson, Martin Ridderstråle, Esa Laurila, Nicholas Houstis, Mark J Daly, Nick Patterson, Jill P Mesirov, Todd R Golub, Pablo Tamayo, Bruce Spiegelman, Eric S Lander, Joel N Hirschhorn, David Altshuler & Leif C Groop |заглавие= PGC-1α-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes|ссылка= https://www.nature.com/articles/ng1180 |издание= Nature Genetics|год= 2003|том= |выпуск= 34 |страницы= 267-273|doi= 10.1038/ng1180}}</ref>, <ref>{{Статья|автор= Sorin Draghici, Purvesh Khatri, Pratik Bhavsar, Abhik Shah, Stephen A. Krawetz, Michael A. Tainsky|заглавие= Onto-Tools, the toolkit of the modern biologist: Onto-Express, Onto-Compare, Onto-Design and Onto-Translate|ссылка= https://academic.oup.com/nar/article/31/13/3775/2904246 |издание= Nucleic Acids Research|год= 2003|том= 31|выпуск= 13|страницы= 3775-3781|doi= 10.1093/nar/gkg624}}</ref>, <ref>{{Статья|автор= Fátima Al-Shahrour, Ramón Díaz-Uriarte, Joaquín Dopazo|заглавие= FatiGO: a web tool for finding significant associations of Gene Ontology terms with groups of genes|ссылка= https://academic.oup.com/bioinformatics/article/20/4/578/192603 |издание= Bioinformatics|год= 2004
|том= 20|выпуск= 4|страницы= 578-580|doi= 10.1093/bioinformatics/btg455}}</ref>, <ref>{{Статья|автор= Stefano Volinia, Rita Evangelisti, Francesca Francioso, Diego Arcelli, Massimo Carella and Paolo Gasparini|заглавие= GOAL: automated Gene Ontology analysis of expression profiles|ссылка= https://www.ncbi.nlm.nih.gov/pmc/articles/PMC441581/ |издание= Nucleic Acids Res.|год= 2004|выпуск= 32(Web Server issue)|страницы= W492–W499|doi= 10.1093/nar/gkh443}}</ref>.


Эти методы используют для анализа результатов экспериментов, которые представляют собой некоторый список генов, отличный от всей выборки генов. Например, анализ обогащения по функциональной принадлежности часто используют для генов, дифференциально [[Экспрессия генов|экспрессирующихся]] в разных условиях, в этом случае задача состоит в том, чтобы извлечь из {{нп5|Профиль экспрессии|профилей экспрессии||Gene expression profiling}}, полученных с использованием [[ДНК-микрочип]]ов, информацию о каких-либо биологических механизмах.
Эти методы используют для анализа результатов экспериментов, которые представляют собой некоторый список генов, отличный от всей выборки генов. Например, анализ обогащения по функциональной принадлежности часто используют для генов, дифференциально [[Экспрессия генов|экспрессирующихся]] в разных условиях, в этом случае задача состоит в том, чтобы извлечь из {{нп5|Профиль экспрессии|профилей экспрессии||Gene expression profiling}}, полученных с использованием [[ДНК-микрочип]]ов, информацию о каких-либо биологических механизмах.

Версия от 09:32, 14 мая 2019

Ана́лиз обогащéния по функциона́льной принадлéжности[1] (англ. gene set enrichment analysis, GSEA [2]) — совокупность методов для ассоциации набора генов с изменением фенотипа [3]. Для формализации существующих данных о фенотипе такие методы часто используют базы данных предварительно аннотированных наборов генов (например, термины проекта Gene ontology (GO): молекулярные функции, биологические процессы или клеточные компоненты [4]). Результатом применения метода (выдачей программы) в этом случае является множество преаннотированных наборов, частота встречаемости которых во входном наборе статистически значимо отличается от фоновой (например, частоты во всём геноме или в другом наборе генов). Такие преаннотированные наборы называют перепредставленными (если частота выше фоновой) или недопредставленными (если частота ниже фоновой).

Данный подход был разработан в 2002-2003 годах независимо несколькими группами ученых и получил широкое распространение. Тогда же были предложены [5] первые программы для его реализации [6], [7], [8], [9], [10], [11].

Эти методы используют для анализа результатов экспериментов, которые представляют собой некоторый список генов, отличный от всей выборки генов. Например, анализ обогащения по функциональной принадлежности часто используют для генов, дифференциально экспрессирующихся в разных условиях, в этом случае задача состоит в том, чтобы извлечь из профилей экспрессии[англ.], полученных с использованием ДНК-микрочипов, информацию о каких-либо биологических механизмах.

Отметим, что термин GSEA употребляется в нескольких значениях: как название широкого класса методов, обсуждаемого в данной статье [12], как название более узкого класса методов [13], как название отдельной программы [14].

Предыстория

С появлением проекта «Геном человека» возникла проблема, как интерпретировать и анализировать большой объём новой информации старыми методами. Использование ДНК-микрочипов позволяет анализировать экспрессию генов, изменяющуюся в ткани у людей с заболеваниями. Данные микрочипов могут быть использованы для классификации тканей по молекулярным характеристикам и для создания гипотез о механизмах заболевания. Этот подход был успешным в изучении рака, где часто наблюдались большие изменения в экспрессии отдельных генов[15]. Однако, когда изменения в экспрессии генов не сильно выражены, большое количество проверенных генов, высокая вариабельность между отдельными лицами и ограниченные размеры выборки, характерные для исследований человека, затрудняют отделение истинных различий от шума. Множество генов могут участвовать в одном метаболическом пути, и поэтому суммарное изменение экспрессии внутри группы генов приводит к разнице в фенотипическом выражении. Анализ представленности функциональных групп генов фокусируется на изменениях экспрессии в группах генов, таким образом, этот метод позволяет решить проблему поиска небольших изменений экспрессии отдельных генов[16].

Подходы

Для формализации и решения задачи GSEA используются методы математической статистики: оценивается значимость некоторой cтатистики, рассчитанной для каждой предварительно аннотированной группы [17].

Обобщенный алгоритм GSEA[18]

Схема обобщенного алгоритма GSEA[19]
  1. Вычисление статистики предварительно аннотированных групп генов — используется один из двух путей:
    • Глобальный тест — построение статистики по входному набору непосредственно для каждой предварительно аннотированной группы, например, на основе теста Хотеллинга[англ.] или ANCOVA[англ.]
    • Объединение статистик генов — построение статистики для отдельных генов, на основе которой строится статистика групп. Тогда последовательно определяются:
      1. Статистика генов — в зависимости от типа исходных данных возможен выбор разных статистик для генов, например, отношение сигнал/шум в эксперименте или отношение правдоподобия[англ.], полученное из предварительной обработки
      2. Трансформация статистики генов — статистика генов может быть трансформирована: так, может быть выполнена ранговая трансформация статистики или в зависимости от значения статистики отобрано некоторое подмножество всех генов для дальнейшего анализа
      3. Статистика набора генов — статистики генов, полученные выше, комбинируются для построения статистики предварительно аннотированных наборов генов: например, статистика группы определяется как среднее значение статистики генов, которые в неё входят
  2. Оценка значимости — формулирование для построенной статистики основной и альтернативной гипотез, оценка значимости статистик. Поскольку таким образом тестируется большое число гипотез (о пере-/недопредставленности каждой предварительно аннотированной группы генов), оценка значимости часто включает поправку на множественное тестирование.

Классификация методов

С точки зрения обобщенного алгоритма, рассмотренного выше, отличие между методами GSEA состоит в последовательности процедур, используемых на разных этапах. Авторы обобщенного алгоритма сравнили 261 комбинацию процедур[20]; авторы обзора 2008 года [21] описывают 68 отдельных программ, реализующих эти методы. В этом обзоре предлагается классификация методов на три основных категории: анализ уникального обогащения (SEA), анализ обогащения набора генов (GSEA — в узком смысле) и анализ модульного обогащения (MEA), при этом некоторые программы относятся к нескольким классам.

Отметим, что не существует общепринятой формальной постановки задачи GSEA (в широком смысле), что затрудняет оценку результатов и сравнение методов [22].

Анализ уникального обогащения

Анализ уникального обогащения (англ. singular enrichment analysis) — методы, которые получают на вход кандидатные гены — гены, относящиеся к некоторой подвыборке генов, которая интересует исследователей (например, гены, достоверно изменившие экспрессию (статистика гена) на заданном уровне значимости), а уже затем для этих генов определяется перепредставленность функциональных групп. Таким образом, эти методы предоставляют исследователю возможность выбрать статистику генов и провести трансформацию — выбрать гены в зависимости от значения статистики, затем строится статистика предварительно аннотированного набора на основе количества генов набора среди кандидатных генов. В качестве статистических моделей используются гипергеометрическое распределение, биномиальное распределение (используется для больших выборок), χ², точный тест Фишера. В большинстве случаев различия между статистическими моделями незначительны[23].

Это простой и эффективный метод, но результат зависит от праметров критерия выбора кандидатных генов. Кроме того, из-за огромного количества генов (типичный результат эксперимента — несколько десятков тысяч профилей экспрессии[24]) взаимосвязи между предварительно аннотированными группами могут теряться[25].

Программы, основанные на этом методе: GoStat, GoMiner, GOTM, BinGO, GOtoolBox, GFinder, Onto-Express, GARBAN, FatiGO, BayGO[25].

Анализ обогащения набора генов

Анализ обогащения набора генов (англ. gene set enrichment analysis) — альтернативные подходы, включающие ранжирование (трансформацию) всех генов в соответствии со степенью проявления признака (статистика гена), по которому происходит анализ. В этом случае рассматривается все множество генов, а не только самые значимые гены. Используются такие статистики групп, как статистика Колмогорова, t-статистика Стьюдента, U-статистика Манна-Уитни, медиана рангов группы[26].

Главное преимущество — этот метод использует всю информацию, полученную из экспериментов. Однако в качестве входной информации он требует определения функциональной группы для каждого гена, что часто бывает сложной задачей. Предположение, лежащее в основе метода, что гены с противоположных концов списка вносят больший вклад в биологическую функцию, не всегда верно, регуляторные белки часто изменяют свою экспрессию незначительно, но это приводит к большим последствиям[25].

Программы, основанные на этом методе: GSEA (название программы), CapMap, FatiScan, ADGO, ermineJ, PAGE, iGA, GO-Mapper, GOdist, FINA, T-profiler, MetaGP[25].

Анализ модульного обогащения

Анализ модульного обогащения (англ. modular enrichment analysis) — методы, которые принимают на вход, как и анализ уникального обогащения, список кандидатных генов, но, в отличие от него, при оценке значимости перепредставленности (то есть на этапах определения статистики набора генов и оценки значимости) рассматривает взаимосвязь терминов GO. Для этого используется, например, статистика Каппа[англ.]. Таким образом может быть описана функция входного набора генов, не соответствующая отдельному термину. Ограничением метода является то, что гены без сильных отношений с соседями будут исключены из анализа[25].

Программы, основанные на этом методе: ADGO, GeneCodis, ProfCom, topGO, Ontologizer, POSOC, DAVID, GoToolBox[25].

Успехи применения

Анализ представленности функциональных групп генов часто используется для того, чтобы охарактеризовать изменения в молекулярных сигнальных путях и попытаться связать эти изменения с конкретными заболеваниями. Ниже приведены некоторые примеры задач, для решения которых использовался анализ представленности функциональных групп генов.

Полногеномный поиск ассоциаций

Однонуклеотидные полиморфизмы (SNP), возникающие в результате точечных мутаций, могут быть ассоциированы с заболеваниями. Полногеномный поиск ассоциаций — сравнение больного и здорового генотипов в попытке найти SNP, которые перепредставлены в геноме больного и могут быть ассоциированы с данным состоянием. До появления анализа обогащения наборов генов точность полногеномного поиска ассоциаций была значительно ограничена большим количеством ложноположительных результатов. Метод GSEA-SNP основан на теории, что SNP, способствующие заболеванию, как правило, группируются в наборе генов, которые участвуют в одном и том же метаболическом пути. Данное применение анализа представленности функциональных групп генов не только помогает в открытии SNP, ассоциированных с заболеваниями, но и помогает осветить соответствующие пути и механизмы заболеваний[27].

Самопроизвольные преждевременные роды

Методы анализа представленности функциональных групп генов привели к открытию новых предполагаемых генов и метаболических путей, связанных с самопроизвольными преждевременными родами. Последовательности экзома женщин, у которых случился выкидыш, сравнивались с экзомами женщин из проекта «1000 геномов»[англ.], таким образом было показано, что гены были кластеризованы в группы, ассоциированные с несколькими путями (биосинтез оксида азота, ангиогенез, иммунный ответ), которые, возможно, связаны с преждевременными родами[28].

Рак почки

Анализ представленности функциональных групп генов может использоваться, чтобы понять изменения, которые клетки претерпевают в ходе канцерогенеза и метастазирования. С помощью микрочипов были получены данные об экспрессии генов в разных клетках (метастазы рака почки, первичные опухоли почки и нормальная ткань почки). Анализ показал значительные изменения в экспрессии генов, участвующих в путях, которые раньше не были ассоциированы с прогрессированием рака почек, но были выявлены в других опухолях. Например, было обнаружено повышение экспрессии гена MCM2[англ.] в метастазах рака почки. MCM2 отвечает за пролиферацию клеток, и повышение экспрессии этого гена является маркером при аденокарциноме яичников[29].

Депрессия

Было показано, что симптомы длительной депрессии коррелируют с изменениями в иммунном ответе и метаболических путях, связанных с воспалением. Для доказательства корреляции проводился анализ образцов крови пациентов с депрессией, чтобы найти разницу в уровне экспрессии в наборах генов, связанных с путями воспаления. У пациентов с наиболее тяжелыми симптомами депрессии наблюдалось значительное повышение уровня экспрессии генов CRP по сравнению с теми, у кого такие симптомы не наблюдались[30].

Неоспороз

Neospora caninum[англ.] — простейшее, которое вызывает неврологические заболевания у собак и крупного рогатого скота. Развитие патологического процесса изучали на мышах. Было обнаружено, что у инфицированных мышей увеличивается экспрессия 772 генов. Для анализа использовалась программа GOstat[31], которая использует информацию из Gene ontology (GO), чтобы получить представление о том, какие аннотации типичны для анализируемого списка генов. В результате, было предсказано, что эти гены ассоциированы с иммунным ответом, метаболизмом липидов и морфогенезом нейронов[32].

Шизофрения

Анализ представленности функциональных групп генов также может использоваться для того, чтобы понять молекулярные механизмы тяжелых расстройств. Шизофрения— сложное заболевание, в значительной степени, передаваемое по наследству. Начало заболевания включает взаимодействие многих генов в нескольких метаболических путях наряду с взаимодействием этих генов с внешними факторами. Метилирование ДНК было проанализировано по отношению к промежуточным фенотипам, связанным с шизофренией. Было обнаружено, что регуляция микроРНК и их мишеней метилированием влияет на физиологические функции мозга и может нести дополнительный риск развития структурных изменений мозга и психических расстройств[33].

Примечания

  1. G. P. Sun, T. Jiang, P. F. Xie, J. Lan. Идентификация генов, ассоциированных с периодонтитом, при помощи сетей коэкспресии // Молекулярная биология. — 2016. — Т. 50, вып. 1. — С. 143—150. — doi:10.7868/S0026898416010195.
  2. Hung J.-H., Yang T.-H., Hu Z., Weng Z., DeLisi C. Gene set enrichment analysis: performance evaluation and usage guidelines (англ.) // Briefings in Bioinformatics. — 2011. — 7 September (vol. 13, no. 3). — P. 281—291. — ISSN 1467-5463. — doi:10.1093/bib/bbr049. [исправить]
  3. Hung J.-H., Yang T.-H., Hu Z., Weng Z., DeLisi C. Gene set enrichment analysis: performance evaluation and usage guidelines (англ.) // Briefings in Bioinformatics. — 2011. — 7 September (vol. 13, no. 3). — P. 281—291. — ISSN 1467-5463. — doi:10.1093/bib/bbr049. [исправить]
  4. Mooney Michael A., Wilmot Beth. Gene set analysis: A step-by-step guide (англ.) // American Journal of Medical Genetics Part B: Neuropsychiatric Genetics. — 2015. — 8 June (vol. 168, no. 7). — P. 517—527. — ISSN 1552-4841. — doi:10.1002/ajmg.b.32328. [исправить]
  5. Rhodes, D. R. & Chinnaiyan, A. M. Integrative analysis of the cancer transcriptome // Nature Genetics. — 2005. — Вып. 37. — С. S31–S37. — doi:10.1038/ng1570.
  6. Scott W Doniger, Nathan Salomonis, Kam D Dahlquist, Karen Vranizan, Steven C Lawlor and Bruce R Conklin. MAPPFinder: using Gene Ontology and GenMAPP to create a global gene-expression profile from microarray data // Genome Biol.. — 2003. — Т. 4, вып. 1. — С. R7. — doi:10.1186/gb-2003-4-1-r7.
  7. Barry R Zeeberg, Weimin Feng, Geoffrey Wang, May D Wang, Anthony T Fojo, Margot Sunshine, Sudarshan Narasimhan, David W Kane, William C Reinhold, Samir Lababidi, Kimberly J Bussey, Joseph Riss, J Carl Barrett and John N Weinstein. GoMiner: a resource for biological interpretation of genomic and proteomic data // Genome Biol. . — 2003. — Вып. 4. — С. R28. — doi:10.1186/gb-2003-4-4-r28.
  8. Vamsi K Mootha, Cecilia M Lindgren, Karl-Fredrik Eriksson, Aravind Subramanian, Smita Sihag, Joseph Lehar, Pere Puigserver, Emma Carlsson, Martin Ridderstråle, Esa Laurila, Nicholas Houstis, Mark J Daly, Nick Patterson, Jill P Mesirov, Todd R Golub, Pablo Tamayo, Bruce Spiegelman, Eric S Lander, Joel N Hirschhorn, David Altshuler & Leif C Groop  PGC-1α-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes // Nature Genetics. — 2003. — Вып. 34. — С. 267-273. — doi:10.1038/ng1180.
  9. Sorin Draghici, Purvesh Khatri, Pratik Bhavsar, Abhik Shah, Stephen A. Krawetz, Michael A. Tainsky. Onto-Tools, the toolkit of the modern biologist: Onto-Express, Onto-Compare, Onto-Design and Onto-Translate // Nucleic Acids Research. — 2003. — Т. 31, вып. 13. — С. 3775-3781. — doi:10.1093/nar/gkg624.
  10. Fátima Al-Shahrour, Ramón Díaz-Uriarte, Joaquín Dopazo. FatiGO: a web tool for finding significant associations of Gene Ontology terms with groups of genes // Bioinformatics. — 2004. — Т. 20, вып. 4. — С. 578-580. — doi:10.1093/bioinformatics/btg455.
  11. Stefano Volinia, Rita Evangelisti, Francesca Francioso, Diego Arcelli, Massimo Carella and Paolo Gasparini. GOAL: automated Gene Ontology analysis of expression profiles // Nucleic Acids Res.. — 2004. — Вып. 32(Web Server issue). — С. W492–W499. — doi:10.1093/nar/gkh443.
  12. Hung J.-H., Yang T.-H., Hu Z., Weng Z., DeLisi C. Gene set enrichment analysis: performance evaluation and usage guidelines (англ.) // Briefings in Bioinformatics. — 2011. — 7 September (vol. 13, no. 3). — P. 281—291. — ISSN 1467-5463. — doi:10.1093/bib/bbr049. [исправить]
  13. Hung J.-H., Yang T.-H., Hu Z., Weng Z., DeLisi C. Gene set enrichment analysis: performance evaluation and usage guidelines (англ.) // Briefings in Bioinformatics. — 2011. — 7 September (vol. 13, no. 3). — P. 281—291. — ISSN 1467-5463. — doi:10.1093/bib/bbr049. [исправить]
  14. Subramanian A., Tamayo P., Mootha V. K., Mukherjee S., Ebert B. L., Gillette M. A., Paulovich A., Pomeroy S. L., Golub T. R., Lander E. S., Mesirov J. P. Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles (англ.) // Proceedings of the National Academy of Sciences. — 2005. — 30 September (vol. 102, no. 43). — P. 15545—15550. — ISSN 0027-8424. — doi:10.1073/pnas.0506580102. [исправить]
  15. T. R. Golub, D. K. Slonim, P. Tamayo, C. Huard, M. Gaasenbeek. Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring (англ.) // Science. — 1999. — 15 October (vol. 286, iss. 5439). — P. 531–537. — ISSN 1095-9203 0036-8075, 1095-9203. — doi:10.1126/science.286.5439.531.
  16. Vamsi K Mootha, Cecilia M Lindgren, Karl-Fredrik Eriksson, Aravind Subramanian, Smita Sihag. PGC-1α-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes (англ.) // Nature Genetics. — 2003/07. — Vol. 34, iss. 3. — P. 267–273. — ISSN 1546-1718. — doi:10.1038/ng1180.
  17. Ackermann Marit, Strimmer Korbinian. A general modular framework for gene set enrichment analysis (англ.) // BMC Bioinformatics. — 2009. — 3 February (vol. 10, no. 1). — ISSN 1471-2105. — doi:10.1186/1471-2105-10-47. [исправить]
  18. Ackermann Marit, Strimmer Korbinian. A general modular framework for gene set enrichment analysis (англ.) // BMC Bioinformatics. — 2009. — 3 February (vol. 10, no. 1). — ISSN 1471-2105. — doi:10.1186/1471-2105-10-47. [исправить]
  19. Ackermann Marit, Strimmer Korbinian. A general modular framework for gene set enrichment analysis (англ.) // BMC Bioinformatics. — 2009. — 3 February (vol. 10, no. 1). — ISSN 1471-2105. — doi:10.1186/1471-2105-10-47. [исправить]
  20. Ackermann Marit, Strimmer Korbinian. A general modular framework for gene set enrichment analysis (англ.) // BMC Bioinformatics. — 2009. — 3 February (vol. 10, no. 1). — ISSN 1471-2105. — doi:10.1186/1471-2105-10-47. [исправить]
  21. Huang Da Wei, Sherman Brad T., Lempicki Richard A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists (англ.) // Nucleic Acids Research. — 2008. — 25 November (vol. 37, no. 1). — P. 1—13. — ISSN 1362-4962. — doi:10.1093/nar/gkn923. [исправить]
  22. Hung J.-H., Yang T.-H., Hu Z., Weng Z., DeLisi C. Gene set enrichment analysis: performance evaluation and usage guidelines (англ.) // Briefings in Bioinformatics. — 2011. — 7 September (vol. 13, no. 3). — P. 281—291. — ISSN 1467-5463. — doi:10.1093/bib/bbr049. [исправить]
  23. Purvesh Khatri, Sorin Drăghici. Ontological analysis of gene expression data: current tools, limitations, and open problems (англ.) // Bioinformatics. — 2005-09-15. — Vol. 21, iss. 18. — P. 3587–3595. — ISSN 1367-4803. — doi:10.1093/bioinformatics/bti565.
  24. Sorin Draghici, Purvesh Khatri, Pratik Bhavsar, Abhik Shah, Stephen A. Krawetz. Onto-Tools, the toolkit of the modern biologist: Onto-Express, Onto-Compare, Onto-Design and Onto-Translate (англ.) // Nucleic Acids Research. — 2003-07-01. — Vol. 31, iss. 13. — P. 3775–3781. — ISSN 0305-1048. — doi:10.1093/nar/gkg624.
  25. 1 2 3 4 5 6 Da Wei Huang, Brad T. Sherman, Richard A. Lempicki. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists (англ.) // Nucleic Acids Research. — 2009-01-01. — Vol. 37, iss. 1. — P. 1–13. — ISSN 0305-1048. — doi:10.1093/nar/gkn923.
  26. Jui-Hung Hung, Tun-Hsiang Yang, Zhenjun Hu, Zhiping Weng, Charles DeLisi. Gene set enrichment analysis: performance evaluation and usage guidelines (англ.) // Briefings in Bioinformatics. — 2012-05-01. — Vol. 13, iss. 3. — P. 281–291. — ISSN 1467-5463. — doi:10.1093/bib/bbr049.
  27. Marit Holden, Shiwei Deng, Leszek Wojnowski, Bettina Kulle. GSEA-SNP: applying gene set enrichment analysis to SNP data from genome-wide association studies (англ.) // Bioinformatics. — 2008-12-01. — Vol. 24, iss. 23. — P. 2784–2785. — ISSN 1367-4803. — doi:10.1093/bioinformatics/btn516.
  28. Tracy A. Manuck, Scott Watkins, M. Sean Esplin, Samuel Parry, Heping Zhang. 242: Gene set enrichment investigation of maternal exome variation in spontaneous preterm birth (SPTB) (англ.) // American Journal of Obstetrics and Gynecology. — Vol. 214, iss. 1. — P. S142–S143. — doi:10.1016/j.ajog.2015.10.280.
  29. Matthias Maruschke, Oliver W Hakenberg, Dirk Koczan, Wolfgang Zimmermann, Christian G Stief. Expression profiling of metastatic renal cell carcinoma using gene set enrichment analysis (англ.) // International Journal of Urology. — 2014-01-01. — Vol. 21, iss. 1. — P. 46–51. — ISSN 1442-2042. — doi:10.1111/iju.12183.
  30. Marko Elovainio, Tuukka Taipale, Ilkka Seppälä, Nina Mononen, Emma Raitoharju. Activated immune–inflammatory pathways are associated with long-standing depressive symptoms: Evidence from gene-set enrichment analyses in the Young Finns Study (англ.) // Journal of Psychiatric Research. — Vol. 71. — P. 120–125. — doi:10.1016/j.jpsychires.2015.09.017.
  31. GOstat by Tim Beissbarth. gostat.wehi.edu.au. Дата обращения: 20 апреля 2018.
  32. Maki Nishimura, Sachi Tanaka, Fumiaki Ihara, Yoshikage Muroi, Junya Yamagishi. Transcriptome and Histopathological Changes in Mouse Brain Infected with Neospora caninum (англ.) // Scientific Reports. — 2015-01-21. — Vol. 5, iss. 1. — ISSN 2045-2322. — doi:10.1038/srep07936.
  33. Johanna Hass, Esther Walton, Carrie Wright, Andreas Beyer, Markus Scholz. Associations between DNA methylation and schizophrenia-related intermediate phenotypes — A gene set enrichment analysis (англ.) // Progress in Neuro-Psychopharmacology and Biological Psychiatry. — Vol. 59. — P. 31–39. — doi:10.1016/j.pnpbp.2015.01.006.