UGENE

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
UGENE
UGENE logo.png
UGENE-1.9.0-ru-overview.png
Тип

Биоинформационная программа

Разработчик

Унипро

Написана на

C++, QtScript

Операционная система

Кроссплатформенное программное обеспечение

Языки интерфейса

русский, английский, чешский, китайский

Последняя версия

1.13.2 (14 апреля 2014 года)

Лицензия

GPL

Сайт

ugene.unipro.ru

UGENE — свободное кроссплатформенное биоинформационное программное обеспечение.[1]

В UGENE интегрированы десятки известных биоинформационных инструментов и алгоритмов, доступных как через графический интерфейс, так и через командную строку. Используя встроенный дизайнер вычислительных схем различные инструменты и алгоритмы могут быть скомпонованы в вычислительную схему.

Чтобы обеспечить максимальное быстродействие вычислений, UGENE использует возможности многоядерных ЦПУ и графических процессоров для оптимизации некоторых вычислительных задач. Имеется также возможность ускорить выполнение необходимой задачи используя облачные вычисления на Amazon EC2.

Основные возможности[править | править исходный текст]

Ниже представлены основные возможности продукта:

Пользовательский интерфейс[править | править исходный текст]

Редактор множественных выравниваний

Имеется три основных представления биологических данных в UGENE.

1. Редактор последовательностей позволяет визуализировать, анализировать и редактировать нуклеотидные или белковые последовательности. Также, для различных типов данных, в окне редактора последовательностей поддерживаются дополнительные возможности визуализации:

  • Отображение 3D структуры белка
  • Круговое представление геномов плазмид
  • Редактор хроматограмм
  • Отображение точечных графиков для ДНК последовательностей
  • Визуализация данных секвенирования (сборок)

2. Редактор множественных выравниваний позволяет работать с нуклеотидным или белковым множественным выравниванием.

3. Визуализатор филогенетических деревьев.

Дизайнер вычислительных схем UGENE[править | править исходный текст]

Дизайнер вычислительных схем

Дизайнер вычислительных схем позволяет составлять и запускать сложные вычислительные схемы из различных алгоритмов.

Каждая схема состоит из вычислительных элементов. Дизайнер содержит элементы для большинства алгоритмов, интегрированных в UGENE. Также имеется возможность создавать собственные элементы.

Созданную вычислительную схему можно запускать как локально, так и удалённо, используя графический пользовательский интерфейс или через командную строку.

Дизайнер запросов UGENE[править | править исходный текст]

Дизайнер запросов

Дизайнер запросов позволяет анализировать заданную пользователем нуклеотидную последовательность используя несколько алгоритмов (например, Поиск повторов, Поиск открытых рамок считывания). При этом на взаимное расположение их результатов накладываются ограничения.

Запрос к последовательности представляется с помощью схемы, которая может быть создана как с помощью графического интерфейса, так и отредактирована вручную с помощью любого текстового редактора.

Результаты выполнения схемы для нуклеотидной последовательности сохраняются как аннотации в указанный файл формата GenBank.

Обозреватель сборок UGENE[править | править исходный текст]

Обозреватель сборок

Создание обозревателя сборок началось в 2010 году в качестве проекта-участника конкурса Illumina iDEA Challenge 2011. Обозреватель сборок позволяет визуализировать и изучать большие (до сотен миллионов коротких последовательностей) данные полногеномного секвенирования (Next-Generatoin Sequencing сборки). На сегодня, поддерживается единственный формат — BAM, являющийся бинарной версией формата SAM. Для просмотра данных в UGENE входной файл должен быть сконвертирован в базу данных — собственный формат UGENE. Такой подход обладает как преимуществами, так и недостатками. Недостатками являются время конвертирования, которое может быть значительным для больших файлов, а также размер баз данных. С другой стороны, конвертирование позволяет удобно обозревать всю сборку целиком, перемещаться по сборке и быстро переходить к плотно покрытым регионам. Вместе с тем, UGENE позволяет выбирать контиги из BAM-файла, которые будут сконвертированы. Таким образом, обозреватель позволяет открывать файлы большого объёма, такие как данные 1000 Genomes Project.

Поддерживаемые форматы биологических данных[править | править исходный текст]

  • Последовательности и аннотации: FASTA (.fa), GenBank (.gb), EMBL (.emb), GFF (.gff)
  • Множественные выравнивания: Clustal (.aln), MSF (.msf), Stockholm (.sto), Nexus (.nex)
  • 3D структуры белка: PDB (.pdb), MMDB (.prt)
  • Хроматограммы: ABIF (.abi), SCF (.scf)
  • Короткие последовательности: Sequence Alignment/Map (SAM) (.sam), бинарная версия SAM (BAM) (.bam), ACE (.ace), FASTQ (.fastq)
  • Филогенетические деревья: Newick (.nwk)
  • Некоторые другие форматы: Bairoch (информация о ферментах), HMM (HMMER профили), PWM and PFM (весовые матрицы)

Цикл выпуска[править | править исходный текст]

Разработка проекта ведется компанией «Унипро». Каждая итерация длится приблизительно 6 недель, после чего выпускается очередная версия. Пользователям также доступны промежуточные предрелизные сборки.

Возможности, которые будут включены в следующие версии во многом определяются запросами со стороны пользователей.

Награды[править | править исходный текст]

В 2010 году UGENE был признан «Лучшим свободным проектом России — 2010» в категории «Групповой проект» в конкурсе журнала Linux Format.

Также, в 2010 году UGENE занял третье место во «Всероссийском ежегодном конкурсе проектов в сфере высокопроизводительных вычислений (High Performance Computing)», поддерживаемом корпорациями Роснано и Intel.

В 2008 году проекту оптимизации алгоритма HMMER в UGENE было присуждено первое место на «Конкурсе по разработке программного обеспечения для процессора PowerXCell 8i», проводимого компанией «Т-Платформы».

Литература[править | править исходный текст]

  1. Okonechnikov, K.; Golosova, O.; Fursov, M.; the UGENE team (2012). «Unipro UGENE: a unified bioinformatics toolkit». Bioinformatics. DOI:10.1093/bioinformatics/bts091.

Аналогичное программное обеспечение[править | править исходный текст]

Ссылки[править | править исходный текст]