Генетический код

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Генети́ческий код — свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов.

В ДНК используется четыре азотистых основания — аденин (А), гуанин (G), цитозин (С), тимин (T), которые в русскоязычной литературе обозначаются буквами А, Г, Ц и Т. Эти буквы составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением нуклеотида, содержащего тимин, который заменён похожим нуклеотидом, содержащим урацил, который обозначается буквой U (У в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

Реализация генетической информации в живых клетках (то есть синтез белка, кодируемого геном) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза мРНК на матрице ДНК) и трансляции генетического кода в аминокислотную последовательность (синтез полипептидной цепи на мРНК). Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трёх последовательных нуклеотидов. Набор из трёх нуклеотидов называется триплетом. Принятые сокращения, соответствующие аминокислотам и кодонам, изображены на рисунке.

История изучения[править | править вики-текст]

Знания о белках и нуклеиновых кислотах накапливались в течение длительного времени. К середине XX века их стало достаточно для того, чтобы выдвинуть первые идеи о природе генетического кода. К 1953 году было известно, что отдельные белки имеют уникальные аминокислотные последовательности и что, по-видимому, не существует никаких ограничений на порядок аминокислот в полипептиде[1]. Имелись данные о том, что белки состоят примерно из 20—23 различных аминокислот, однако списки различались у разных авторов. В генетике была сформирована концепция «один ген — один фермент» (более точно «один ген — один полипептид»), также было установлено, что гены это ДНК, а не белки[2].

В 1953 году Уотсон и Крик опубликовали две работы: в первой говорилось о вторичной структуре ДНК[3], а во второй — о возможном механизме копирования ДНК путём матричного синтеза[4]. В последней работе, они указали на то, что определённая последовательность оснований является кодом, который несёт генетическую информацию. Теперь предстояло решить вопрос о том, как эта последовательность оснований определяет последовательность аминокислот в белках.

Хотя некоторые предположения о механизме кодирования высказывались и раньше[5], первым кто предложил абстрактную гипотезу кодирования, а также способ её проверки, был советский и американский физик-теоретик Георгий (Джордж) Гамов. В 1954 году Гамов опубликовал свою работу, в которой предложил в качестве механизма кодирования установление соответствия между боковыми цепями аминокислот и ромбовидными «дырами», образованными четырьмя нуклеотидами ДНК[6]. Позднее этот код был назван ромбическим или бубновым. Исходя из своей модели Гамов предположил, что код может быть триплетным. Несмотря на все очевидные недочёты этой гипотезы (например, идея о том, что структура белка напрямую кодируется ДНК) она стала первой среди многих более и менее абстрактных гипотез о природе кода. Гамов был первым, кто представил проблему кодирования не как биохимическую, а просто как задачу перевода из четырёхзначной системы в двадцатизначную.

За несколько последующих лет было предложено большое количество разных моделей. Все предложенные коды можно разделить на две категории: перекрывающиеся (один нуклеотид входит в состав более чем одного кодона) и неперекрывающиеся. К перекрывающимся кодам относятся треугольный, мажорно-минорный и последовательный коды Гамова с коллегами[7]. По мере накопления данных об аминокислотных последовательностях белков, стало ясно, что порядок аминокислот в них может быть любым, поэтому нужно отдавать предпочтение неперекрывающимся кодам. Наиболее известными неперекрывающимися кодами являются комбинационный код Гамова и Ичаса и «код без запятых» Крика, Гриффита и Оргела. Согласно комбинационному коду аминокислоты кодируются триплетами нуклеотидов, при этом значение имеет не порядок нуклеотидов в триплете, а его состав (например, триплеты ТТА, ТАТ и АТТ кодируют одну и ту же аминокислоту)[8]. «Код без запятых» даёт объяснение тому, как выбирается рамка считывания[9]. Согласно этой модели, некоторые триплеты имеют смысл (соответствуют аминокислотам), а некоторые — нет. При этом код устроен таким образом, что если расположить любые значащие триплеты друг за другом, то триплеты в другой рамке считывания будут бессмысленными. Крик с соавторами показали, что можно подобрать триплеты, удовлетворяющие этим требованиям, и что их ровно 20. Несмотря на то что сами авторы сомневались в обоснованности этой модели, она получила признание и господствовала в течение следующих пяти лет[10].

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

Свойства[править | править вики-текст]

  1. Триплетность — значащей единицей кода является сочетание трёх нуклеотидов (триплет, или кодон).
  2. Непрерывность — между триплетами нет знаков препинания, то есть информация считывается непрерывно.
  3. Неперекрываемость — один и тот же нуклеотид не может входить одновременно в состав двух или более триплетов (не соблюдается для некоторых перекрывающихся генов вирусов, митохондрий и бактерий, которые кодируют несколько белков, считывающихся со сдвигом рамки).
  4. Однозначность (специфичность) — определённый кодон соответствует только одной аминокислоте (однако, кодон UGA у Euplotes crassus кодирует две аминокислоты — цистеин и селеноцистеин)[11]
  5. Вырожденность (избыточность) — одной и той же аминокислоте может соответствовать несколько кодонов.
  6. Универсальность — генетический код работает одинаково в организмах разного уровня сложности — от вирусов до человека (на этом основаны методы генной инженерии; есть ряд исключений, показанный в таблице раздела «Вариации стандартного генетического кода» ниже).
  7. Помехоустойчивость — мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными; мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными.
  8. Знаки препинания-триплеты выполняют функцию знаков препинания.

Таблицы соответствия кодонов мРНК и аминокислот[править | править вики-текст]

Генетический код, общий для большинства про- и эукариот. В таблице приведены все 64 кодона и указаны соответствующие аминокислоты. Порядок оснований — от 5' к 3' концу мРНК.
2-е основание
U C A G
1-е
основание
U

UUU (Phe/F)Фенилаланин
UUC (Phe/F)Фенилаланин
UUA (Leu/L)Лейцин
UUG (Leu/L)Лейцин

UCU (Ser/S)Серин
UCC (Ser/S)Серин
UCA (Ser/S)Серин
UCG (Ser/S)Серин

UAU (Tyr/Y)Тирозин
UAC (Tyr/Y)Тирозин
UAA Ochre (Стоп)
UAG Amber (Стоп)

UGU (Cys/C)Цистеин
UGC (Cys/C)Цистеин
UGA Opal (Стоп)
UGG (Trp/W)Триптофан

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

CCU (Pro/P)Пролин
CCC (Pro/P)Пролин
CCA (Pro/P)Пролин
CCG (Pro/P)Пролин

CAU (His/H)Гистидин
CAC (His/H)Гистидин
CAA (Gln/Q)Глутамин
CAG (Gln/Q)Глутамин

CGU (Arg/R)Аргинин
CGC (Arg/R)Аргинин
CGA (Arg/R)Аргинин
CGG (Arg/R)Аргинин

A

AUU (Ile/I)Изолейцин
AUC (Ile/I)Изолейцин
AUA (Ile/I)Изолейцин
AUG (Met/M)Метионин, Start[12]

ACU (Thr/T)Треонин
ACC (Thr/T)Треонин
ACA (Thr/T)Треонин
ACG (Thr/T)Треонин

AAU (Asn/N)Аспарагин
AAC (Asn/N)Аспарагин
AAA (Lys/K)Лизин
AAG (Lys/K)Лизин

AGU (Ser/S)Серин
AGC (Ser/S)Серин
AGA (Arg/R)Аргинин
AGG (Arg/R)Аргинин

G

GUU (Val/V)Валин
GUC (Val/V)Валин
GUA (Val/V)Валин
GUG (Val/V)Валин

GCU (Ala/A)Аланин
GCC (Ala/A)Аланин
GCA (Ala/A)Аланин
GCG (Ala/A)Аланин

GAU (Asp/D)Аспарагиновая кислота
GAC (Asp/D)Аспарагиновая кислота
GAA (Glu/E)Глутаминовая кислота
GAG (Glu/E)Глутаминовая кислота

GGU (Gly/G)Глицин
GGC (Gly/G)Глицин
GGA (Gly/G)Глицин
GGG (Gly/G)Глицин

Секторный вариант записи, внутренний круг — 1-е основание кодона (от 5'-конца)


Обратная таблица (указаны кодоны для каждой аминокислоты, а также стоп-кодоны)
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
START AUG STOP UAG, UGA, UAA

Вариации стандартного генетического кода[править | править вики-текст]

Первый пример отклонения от стандартного генетического кода был открыт в 1979 году при исследовании генов митохондрий человека. С того времени было найдено несколько подобных вариантов[13], включая многообразные альтернативные митохондриальные коды,[14] например, прочитывание стоп-кодона УГА в качестве кодона, определяющего триптофан у микоплазм. У бактерий и архей ГУГ и УУГ часто используются как стартовые кодоны. В некоторых случаях гены начинают кодировать белок со старт-кодона, который отличается от обычно используемого данным видом[13].

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин, вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК. Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода[13][15].
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондрии млекопитающих, дрозофилы, S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

Эволюция[править | править вики-текст]

Считается, что триплетный код сложился достаточно рано в ходе эволюции жизни. Но существование различий в некоторых организмах, появившихся на разных эволюционных стадиях, указывает на то, что он был не всегда таким.

Согласно некоторым моделям, сначала код существовал в примитивном виде, когда малое число кодонов обозначало сравнительно небольшое число аминокислот. Более точное значение кодонов и большее число аминокислот могли быть введены позже. Сначала только первые два из трёх оснований могли быть использованы для узнавания [что зависит от структуры тРНК].

Б. Льюин. Гены, М.: 1987, с. 62.

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. SANGER F. (1952). «The arrangement of amino acids in proteins.». Adv Protein Chem. 7: 1—67. PMID 14933251.
  2. М. Ичас Биологический код. — Мир, 1971.
  3. WATSON JD, CRICK FH. (April 1953). «Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.». Nature 171: 737—738. PMID 13054692.
  4. WATSON JD, CRICK FH. (May 1953). «Genetical implications of the structure of deoxyribonucleic acid.». Nature 171: 964—967. PMID 13063483.
  5. Crick FH. (April 1966). «The genetic code — yesterday, today, and tomorrow.». Cold Spring Harb Symp Quant Biol.: 1—9. PMID 5237190.
  6. G. GAMOW (February 1954). «Possible Relation between Deoxyribonucleic Acid and Protein Structures.». Nature 173: 318. DOI:10.1038/173318a0. PMID 13882203.
  7. GAMOW G, RICH A, YCAS M. (1956). «The problem of information transfer from the nucleic acids to proteins.». Adv Biol Med Phys. 4: 23—68. PMID 13354508.
  8. Gamow G, Ycas M. (1955). «STATISTICAL CORRELATION OF PROTEIN AND RIBONUCLEIC ACID COMPOSITION.». Proc Natl Acad Sci U S A. 41: 1011—1019. PMID 16589789.
  9. Crick FH, Griffith JS, Orgel LE. (1957). «CODES WITHOUT COMMAS.». Proc Natl Acad Sci U S A. 43: 416—421. PMID 16590032.
  10. Hayes B. (1998). «The Invention of the Genetic Code.» (PDF reprint). American Scientist 86: 8—14.
  11. Genetic code supports targeted insertion of two amino acids by one codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 2009 Jan 9;323(5911):259-61.
  12. Кодон AUG кодирует метионин, но одновременно служит стартовым кодоном — с первого AUG-кодона мРНК как правило начинается трансляция.
  13. 1 2 3 NCBI: «The Genetic Codes», Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell
  14. Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts., Experientia. 1990 Dec 1;46(11-12):1117-26.
  15. Osawa S, Jukes TH, Watanabe K, Muto A (March 1992). «Recent evidence for evolution of the genetic code». Microbiol. Rev. 56 (1): 229–64. PMID 1579111.

Литература[править | править вики-текст]

Ссылки[править | править вики-текст]