Структура ДНК (двойная спираль). Различные атомы в структуре показаны в разных цветах; детальная структура двух пар оснований показана снизу справа
Двойная спираль (двойной винт) ДНК (правый)

Дезоксирибонуклеи́новая кислота́ (ДНК) — макромолекула (одна из трёх основных, две другие — РНК и белки), обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования живых организмов. Молекула ДНК хранит биологическую информацию в виде генетического кода, состоящего из последовательности нуклеотидов[1]. ДНК содержит информацию о структуре различных видов РНК и белков.

В клетках эукариот (животных, растений и грибов) ДНК находится в ядре клетки в составе хромосом, а также в некоторых клеточных органеллах (митохондриях и пластидах). В клетках прокариотических организмов (бактерий и архей) кольцевая или линейная молекула ДНК, так называемый нуклеоид, прикреплена изнутри к клеточной мембране. У них и у низших эукариот (например, дрожжей) встречаются также небольшие автономные, преимущественно кольцевые молекулы ДНК, называемые плазмидами. Кроме того, одно- или двухцепочечные молекулы ДНК могут образовывать геном ДНК-содержащих вирусов.

С химической точки зрения ДНК — это длинная полимерная молекула, состоящая из повторяющихся блоков — нуклеотидов. Каждый нуклеотид состоит из азотистого основания, сахара (дезоксирибозы) и фосфатной группы. Связи между нуклеотидами в цепи образуются за счёт дезоксирибозы и фосфатной группы (фосфодиэфирные связи). В подавляющем большинстве случаев (кроме некоторых вирусов, содержащих одноцепочечную ДНК) макромолекула ДНК состоит из двух цепей, ориентированных азотистыми основаниями друг к другу. Эта двухцепочечная молекула закручена по винтовой линии. В целом структура молекулы ДНК получила традиционное, но ошибочное название «двойной спирали», на самом же деле она является «двойным винтом». Винтовая линия может быть правой (A- и B-формы ДНК) или левой (Z-форма ДНК)[2].

В ДНК встречается четыре вида азотистых оснований (аденин (A), гуанин (G), тимин (T) и цитозин (C)). Азотистые основания одной из цепей соединены с азотистыми основаниями другой цепи водородными связями согласно принципу комплементарности: аденин (A) соединяется только с тимином (T), гуанин (G) — только с цитозином (C). Последовательность нуклеотидов позволяет «кодировать» информацию о различных типах РНК, наиболее важными из которых являются информационные, или матричные (мРНК), рибосомальные (рРНК) и транспортные (тРНК). Все эти типы РНК синтезируются на матрице ДНК за счёт копирования последовательности ДНК в последовательность РНК, синтезируемой в процессе транскрипции, и принимают участие в биосинтезе белков (процессе трансляции). Помимо кодирующих последовательностей, ДНК клеток содержит последовательности, выполняющие регуляторные и структурные функции. Кроме того, в геноме эукариот часто встречаются участки, принадлежащие «генетическим паразитам», например, транспозонам.

Расшифровка структуры ДНК (1953 год) стала одним из поворотных моментов в истории биологии. За выдающийся вклад в это открытие Фрэнсису Крику, Джеймсу Уотсону и Морису Уилкинсу была присуждена Нобелевская премия по физиологии или медицине 1962 года. Розалинд Франклин, которая получила рентгенограммы, без которых Уотсон и Крик не имели бы возможность сделать выводы о структуре ДНК, умерла в 1958 году от рака (Нобелевскую премию не дают посмертно)[3].

История изучения

ДНК как химическое вещество была выделена Иоганном Фридрихом Мишером в 1869 году из остатков клеток, содержащихся в гное. Он выделил вещество, в состав которого входят азот и фосфор. Вначале новое вещество получило название нуклеин, а позже, когда Мишер определил, что это вещество обладает кислотными свойствами, вещество получило название нуклеиновая кислота[4]. Биологическая функция новооткрытого вещества была неясна, и долгое время ДНК считалась запасником фосфора в организме. Более того, даже в начале XX века многие биологи считали, что ДНК не имеет никакого отношения к передаче информации, поскольку строение молекулы, по их мнению, было слишком однообразным и не могло содержать закодированную информацию.

Постепенно было доказано, что именно ДНК, а не белки, как считалось раньше, является носителем генетической информации. Одно из первых решающих доказательств принесли эксперименты Освальда Эвери, Колина Маклауда и Маклина Маккарти (1944 г.) по трансформации бактерий. Им удалось показать, что за так называемую трансформацию (приобретение болезнетворных свойств безвредной культурой в результате добавления в неё мёртвых болезнетворных бактерий) отвечает выделенная из пневмококков ДНК. Эксперимент американских учёных Алфреда Херши и Марты Чейз (эксперимент Херши — Чейз, 1952 г.) с помеченными радиоактивными изотопами белками и ДНК бактериофагов показали, что в заражённую клетку передаётся только нуклеиновая кислота фага, а новое поколение фага содержит такие же белки и нуклеиновую кислоту, как исходный фаг[5].

Вплоть до 50-х годов XX века точное строение ДНК, как и способ передачи наследственной информации, оставалось неизвестным. Хотя и было доподлинно известно, что ДНК состоит из нескольких цепочек, состоящих из нуклеотидов, никто не знал точно, сколько этих цепочек и как они соединены.

В результате работы группы биохимика Эрвина Чаргаффа в 1949—1951 гг. были сформулированы так называемые правила Чаргаффа. Чаргаффу и сотрудникам удалось разделить нуклеотиды ДНК при помощи бумажной хроматографии и определить точные количественные соотношения нуклеотидов разных типов. Соотношение, выявленное для аденина (А), тимина (Т), гуанина (Г) и цитозина (Ц), оказалось следующим: количество аденина равно количеству тимина, а гуанина — цитозину: А=Т, Г=Ц[6][7]. Эти правила, наряду с данными рентгеноструктурного анализа, сыграли решающую роль в расшифровке структуры ДНК.

Структура двойной спирали ДНК была предложена Френсисом Криком и Джеймсом Уотсоном в 1953 году на основании рентгеноструктурных данных, полученных Морисом Уилкинсом и Розалинд Франклин, и правил Чаргаффа[8]. Позже предложенная Уотсоном и Криком модель строения ДНК была доказана, а их работа отмечена Нобелевской премией по физиологии или медицине 1962 г. Среди лауреатов не было скончавшейся к тому времени от рака Розалинд Франклин, так как премия не присуждается посмертно[9].

Интересно, что в 1957 году американцы Александер Рич, Гэри Фелзенфелд и Дэйвид Дэйвис описали нуклеиновую кислоту, составленную тремя спиралями[10]. А в 1985—1986 годах Максим Давидович Франк-Каменецкий в Москве показал, как двухспиральная ДНК складывается в так называемую H-форму, составленную уже не двумя, а тремя нитями ДНК[11][12].

Структура молекулы

Нуклеотиды

Adenine.svg Guanine chemical structure.png Thymine chemical structure.png Cytosine chemical structure.png
Аденин (A) Гуанин (G) Тимин (T) Цитозин (C)
Структуры оснований в составе ДНК

Дезоксирибонуклеиновая кислота (ДНК) представляет собой биополимер (полианион), мономером которого является нуклеотид[13][14].

Каждый нуклеотид состоит из остатка фосфорной кислоты, присоединённого по 5'-положению к сахару дезоксирибозе, к которому также через гликозидную связь (C—N) по 1'-положению присоединено одно из четырёх азотистых оснований. Именно наличие характерного сахара и составляет одно из главных различий между ДНК и РНК, зафиксированное в названиях этих нуклеиновых кислот (в состав РНК входит сахар рибоза)[15]. Пример нуклеотида — аденозинмонофосфат, у которого основанием, присоединённым к фосфату и рибозе, является аденин (A) (показан на рисунке).

Исходя из структуры молекул, основания, входящие в состав нуклеотидов, разделяют на две группы: пурины (аденин [A] и гуанин [G]) образованы соединёнными пяти- и шестичленным гетероциклами; пиримидины (цитозин [C] и тимин [T]) — шестичленным гетероциклом[16].

В виде исключения, например, у бактериофага PBS1, в ДНК встречается пятый тип оснований — урацил ([U]), пиримидиновое основание, отличающееся от тимина отсутствием метильной группы на кольце, обычно заменяющее тимин в РНК[17].

Следует отметить, что тимин (T) и урацил (U) не так строго приурочены к ДНК и РНК соответственно, как это считалось ранее. Так, после синтеза некоторых молекул РНК значительное число урацилов в этих молекулах метилируется с помощью специальных ферментов, превращаясь в тимин. Это происходит в транспортных и рибосомальных РНК[18].

Двойная спираль

В зависимости от концентрации ионов и нуклеотидного состава молекулы, двойная спираль ДНК в живых организмах существует в разных формах. На рисунке представлены формы A, B и Z (слева направо)

Полимер ДНК обладает довольно сложной структурой. Нуклеотиды соединены между собой ковалентно в длинные полинуклеотидные цепи. Эти цепи в подавляющем большинстве случаев (кроме некоторых вирусов, обладающих одноцепочечными ДНК-геномами) попарно объединяются при помощи водородных связей во вторичную структуру, получившую название двойной спирали[8][15]. Остов каждой из цепей состоит из чередующихся фосфатов и сахаров[19]. Внутри одной цепи ДНК соседние нуклеотиды соединены фосфодиэфирными связями, которые формируются в результате взаимодействия между 3'-гидроксильной (3'—ОН) группой молекулы дезоксирибозы одного нуклеотида и 5'-фосфатной группой (5'—РО3) другого. Асимметричные концы цепи ДНК называются 3' (три прайм) и 5' (пять прайм). Полярность цепи играет важную роль при синтезе ДНК (удлинение цепи возможно только путём присоединения новых нуклеотидов к свободному 3'-концу).

Как уже было сказано выше, у подавляющего большинства живых организмов ДНК состоит не из одной, а из двух полинуклеотидных цепей. Эти две длинные цепи закручены одна вокруг другой в виде двойной спирали, стабилизированной водородными связями, образующимися между обращёнными друг к другу азотистыми основаниями входящих в неё цепей. В природе эта спираль, чаще всего, правозакрученная. Направления от 3'-конца к 5'-концу в двух цепях, из которых состоит молекула ДНК, противоположны (цепи «антипараллельны» друг другу).

Ширина двойной спирали составляет от 22 до 24 Å, или 2,2—2,4 нм, длина каждого нуклеотида 3,3 Å (0,33 нм)[20]. Подобно тому, как в винтовой лестнице сбоку можно увидеть ступеньки, на двойной спирали ДНК в промежутках между фосфатным остовом молекулы можно видеть рёбра оснований, кольца которых расположены в плоскости, перпендикулярной по отношению к продольной оси макромолекулы.

В двойной спирали различают малую (12 Å) и большую (22 Å) бороздки[21]. Белки, например, факторы транскрипции, которые присоединяются к определённым последовательностям в двухцепочечной ДНК, обычно взаимодействуют с краями оснований в большой бороздке, где те более доступны[22].

Образование связей между основаниями

Каждое основание на одной из цепей связывается с одним определённым основанием на второй цепи. Такое специфическое связывание называется комплементарным. Пурины комплементарны пиримидинам (то есть способны к образованию водородных связей с ними): аденин образует связи только с тимином, а цитозин — с гуанином. В двойной спирали цепочки также связаны с помощью гидрофобных взаимодействий и стэкинга, которые не зависят от последовательности оснований ДНК[23].

Комплементарность двойной спирали означает, что информация, содержащаяся в одной цепи, содержится и в другой цепи. Обратимость и специфичность взаимодействий между комплементарными парами оснований важна для репликации ДНК и всех остальных функций ДНК в живых организмах.

Так как водородные связи нековалентны, они легко разрываются и восстанавливаются. Цепочки двойной спирали могут расходиться как замок-молния под действием ферментов (хеликазы) или при высокой температуре[24]. Разные пары оснований образуют разное количество водородных связей. АТ связаны двумя, ГЦ — тремя водородными связями, поэтому на разрыв ГЦ требуется больше энергии. Процент ГЦ-пар и длина молекулы ДНК определяют количество энергии, необходимой для диссоциации цепей: длинные молекулы ДНК с большим содержанием ГЦ более тугоплавки[25].

Части молекул ДНК, которые из-за их функций должны быть легко разделяемы, например, ТАТА последовательность в бактериальных промоторах, обычно содержат большое количество А и Т.

Химические модификации оснований

Cytosin.svg 5-Methylcytosine.svg Thymin.svg
Цитозин 5-метилцитозин Тимин
Структура цитозина, 5-метилцитозина и тимина. Тимин может возникать путём деаминирования 5-метилцитозина

Азотистые основания в составе ДНК могут быть ковалентно модифицированы, что используется при регуляции экспрессии генов. Например, в клетках позвоночных метилирование цитозина с образованием 5-метилцитозина используется соматическими клетками для передачи профиля генной экспрессии дочерним клеткам. Метилирование цитозина не влияет на спаривание оснований в двойной спирали ДНК. У позвоночных метилирование ДНК в соматических клетках ограничивается метилированием цитозина в последовательности ЦГ[26]. Средний уровень метилирования отличается у разных организмов, так, у нематоды Caenorhabditis elegans метилирование цитозина не наблюдается, а у позвоночных обнаружен высокий уровень метилирования — до 1 %[27]. Другие модификации оснований включают метилирование аденина у бактерий и гликозилирование урацила с образованием «J-основания» в кинетопластах[28].

Метилирование цитозина с образованием 5-метилцитозина в промоторной части гена коррелирует с его неактивным состоянием[29]. Метилирование цитозина важно также для инактивации Х-хромосомы у млекопитающих[30]. Метилирование ДНК используется в геномном импринтинге[31]. Значительные нарушения профиля метилирования ДНК происходят при канцерогенезе[32].

Несмотря на биологическую роль, 5-метилцитозин может спонтанно утрачивать аминную группу (деаминироваться), превращаясь в тимин, поэтому метилированные цитозины являются источником повышенного числа мутаций[33].

Повреждения ДНК

Интеркалированное химическое соединение, которое находится в середине спирали — бензопирен, основной мутаген табачного дыма[34]

ДНК может повреждаться разнообразными мутагенами, к которым относятся окисляющие и алкилирующие вещества, а также высокоэнергетическая электромагнитная радиация — ультрафиолетовое и рентгеновское излучение. Тип повреждения ДНК зависит от типа мутагена. Например, ультрафиолет повреждает ДНК путём образования в ней димеров тимина, которые возникают при образовании ковалентных связей между соседними основаниями[35].

Оксиданты, такие как свободные радикалы или пероксид водорода, приводят к нескольким типам повреждения ДНК, включая модификации оснований, в особенности гуанозина, а также двухцепочечные разрывы в ДНК[36]. По некоторым оценкам, в каждой клетке человека окисляющими соединениями ежедневно повреждается порядка 500 оснований[37][38]. Среди разных типов повреждений наиболее опасные — это двухцепочечные разрывы, потому что они трудно репарируются и могут привести к потерям участков хромосом (делециям) и транслокациям.

Многие молекулы мутагенов вставляются (интеркалируют) между двумя соседними парами оснований. Большинство этих соединений, например, бромистый этидий, даунорубицин, доксорубицин и талидомид, имеет ароматическую структуру. Для того чтобы интеркалирующее соединение могло поместиться между основаниями, они должны разойтись, расплетая и нарушая структуру двойной спирали. Эти изменения в структуре ДНК мешают транскрипции и репликации, вызывая мутации. Поэтому интеркалирующие соединения часто являются канцерогенами, наиболее известные из которых — бензопирен, акридины, афлатоксин и бромистый этидий[39][40][41]. Несмотря на эти негативные свойства, в силу их способности подавлять транскрипцию и репликацию ДНК, интеркалирующие соединения используются в химиотерапии для подавления быстро растущих клеток рака[42].

Некоторые вещества (цисплатин[43], митомицин C[44], псорален[45]) образуют поперечные сшивки между нитями ДНК и подавляют синтез ДНК, благодаря чему используются в химиотерапии некоторых видов рака (см. Химиотерапия злокачественных новообразований).

Суперскрученность

Если взяться за концы верёвки и начать скручивать их в разные стороны, она становится короче и на верёвке образуются «супервитки». Так же может быть суперскручена и ДНК. В обычном состоянии цепочка ДНК делает один оборот на каждые 10,459 основания, но в суперскрученном состоянии спираль может быть свёрнута туже или расплетена[46]. Выделяют два типа суперскручивания: положительное — в направлении нормальных витков, при котором основания расположены ближе друг к другу; и отрицательное — в противоположном направлении. В природе молекулы ДНК обычно находятся в отрицательном суперскручивании, которое вносится ферментами — топоизомеразами[47]. Эти ферменты удаляют дополнительное скручивание, возникающее в ДНК в результате транскрипции и репликации[48].

Структура теломер. Зелёным цветом показан ион металла, хелатированный в центре структуры[49]

Структуры на концах хромосом

На концах линейных хромосом находятся специализированные структуры ДНК, называемые теломерами. Основная функция этих участков — поддержание целостности концов хромосом[50]. Теломеры также защищают концы ДНК от деградации экзонуклеазами и предотвращают активацию системы репарации[51]. Поскольку обычные ДНК-полимеразы не могут реплицировать 3' концы хромосом, это делает специальный фермент — теломераза.

В клетках человека теломеры часто представлены одноцепочечной ДНК и состоят из нескольких тысяч повторяющихся единиц последовательности ТТАГГГ[52]. Эти последовательности с высоким содержанием гуанина стабилизируют концы хромосом, формируя очень необычные структуры, называемые G-квадруплексами и состоящие из четырёх, а не двух взаимодействующих оснований. Четыре гуаниновых основания, все атомы которых находятся в одной плоскости, образуют пластинку, стабилизированную водородными связями между основаниями и хелатированием в центре неё иона металла (чаще всего калия). Эти пластинки располагаются стопкой друг над другом[53].

На концах хромосом могут образовываться и другие структуры: основания могут быть расположены в одной цепочке или в разных параллельных цепочках. Кроме этих «стопочных» структур теломеры формируют большие петлеобразные структуры, называемые Т-петли или теломерные петли. В них одноцепочечная ДНК располагается в виде широкого кольца, стабилизированного теломерными белками[54]. В конце Т-петли одноцепочечная теломерная ДНК присоединяется к двухцепочечной ДНК, нарушая спаривание цепочек в этой молекуле и образуя связи с одной из цепей. Это трёхцепочечное образование называется Д-петля (от англ. displacement loop)[53].

Биологические функции

ДНК является носителем генетической информации, записанной в виде последовательности нуклеотидов с помощью генетического кода. С молекулами ДНК связаны два основополагающих свойства живых организмов — наследственность и изменчивость. В ходе процесса, называемого репликацией ДНК, образуются две копии исходной цепочки, наследуемые дочерними клетками при делении, отсюда следует, что образовавшиеся клетки оказываются генетически идентичны исходной.

Генетическая информация реализуется при экспрессии генов в процессах транскрипции (синтеза молекул РНК на матрице ДНК) и трансляции (синтеза белков на матрице РНК).

Последовательность нуклеотидов «кодирует» информацию о различных типах РНК: информационных, или матричных (мРНК), рибосомальных (рРНК) и транспортных (тРНК). Все эти типы РНК синтезируются на основе ДНК в процессе транскрипции. Роль их в биосинтезе белков (процессе трансляции) различна. Информационная РНК содержит информацию о последовательности аминокислот в белке, рибосомальные РНК служат основой для рибосом (сложных нуклеопротеиновых комплексов, основная функция которых — сборка белка из отдельных аминокислот на основе иРНК), транспортные РНК доставляют аминокислоты к месту сборки белков — в активный центр рибосомы, «ползущей» по иРНК.

Структура генома

ДНК генома бактериофага: фотография под просвечивающим электронным микроскопом

Большинство природных ДНК имеет двухцепочечную структуру, линейную (эукариоты, некоторые вирусы и отдельные роды бактерий) или кольцевую (прокариоты, хлоропласты и митохондрии). Линейную одноцепочечную ДНК содержат некоторые вирусы и бактериофаги. Молекулы ДНК находятся in vivo в плотно упакованном, конденсированном состоянии[55]. В клетках эукариот ДНК располагается главным образом в ядре и на стадии профазы, метафазы или анафазы митоза доступны для наблюдения с помощью светового микроскопа в виде набора хромосом. Бактериальная (прокариоты) ДНК обычно представлена одной кольцевой молекулой ДНК, расположенной в неправильной формы образовании в цитоплазме, называемым нуклеоидом[56]. Генетическая информация генома состоит из генов. Ген — единица передачи наследственной информации и участок ДНК, который влияет на определённую характеристику организма. Ген содержит открытую рамку считывания, которая транскрибируется, а также регуляторные последовательности (англ.), например, промотор и энхансер, которые контролируют экспрессию открытых рамок считывания.

У многих видов только малая часть общей последовательности генома кодирует белки. Так, только около 1,5 % генома человека состоит из кодирующих белок экзонов, а больше 50 % ДНК человека состоит из некодирующих повторяющихся последовательностей ДНК[57]. Причины наличия такого большого количества некодирующей ДНК в эукариотических геномах и огромная разница в размерах геномов (С-значение) — одна из неразрешённых научных загадок[58]; исследования в этой области также указывают на большое количество фрагментов реликтовых вирусов в этой части ДНК.

Последовательности генома, не кодирующие белок

В настоящее время накапливается всё больше данных, противоречащих идее о некодирующих последовательностях как «мусорной ДНК» (англ. junk DNA). Теломеры и центромеры содержат малое число генов, но они важны для функционирования и стабильности хромосом[51][59]. Часто встречающаяся форма некодирующих последовательностей человека — псевдогены, копии генов, инактивированные в результате мутаций[60]. Эти последовательности нечто вроде молекулярных ископаемых, хотя иногда они могут служить исходным материалом для дупликации и последующей дивергенции генов[61]. Другой источник разнообразия белков в организме — это использование интронов в качестве «линий разреза и склеивания» в альтернативном сплайсинге[62]. Наконец, не кодирующие белок последовательности могут кодировать вспомогательные клеточные РНК, например, мяРНК[63]. Недавнее исследование транскрипции генома человека показало, что 10 % генома даёт начало полиаденилированным РНК[64], а исследование генома мыши показало, что 62 % его транскрибируется[65].

Транскрипция и трансляция

Генетическая информация, закодированная в ДНК, должна быть прочитана и в конечном итоге выражена в синтезе различных биополимеров, из которых состоят клетки. Последовательность оснований в цепочке ДНК напрямую определяет последовательность оснований в РНК, на которую она «переписывается» в процессе, называемом транскрипцией. В случае мРНК эта последовательность определяет аминокислоты белка. Соотношение между нуклеотидной последовательностью мРНК и аминокислотной последовательностью определяется правилами трансляции, которые называются генетическим кодом. Генетический код состоит из трёхбуквенных «слов», называемых кодонами, состоящих из трёх нуклеотидов (то есть ACT, CAG, TTT и т. п.). Во время транскрипции нуклеотиды гена копируются на синтезируемую РНК РНК-полимеразой. Эта копия в случае мРНК декодируется рибосомой, которая «читает» последовательность мРНК, осуществляя спаривание матричной РНК с транспортными РНК, которые присоединены к аминокислотам. Поскольку в трёхбуквенных комбинациях используются 4 основания, всего возможны 64 кодона (4³ комбинации). Кодоны кодируют 20 стандартных аминокислот, каждой из которых соответствует в большинстве случаев более одного кодона. Один из трёх кодонов, которые располагаются в конце мРНК, не означает аминокислоту и определяет конец белка, это «стоп» или «нонсенс» кодоны — TAA, TGA, TAG.

Репликация

Деление клеток необходимо для размножения одноклеточного и роста многоклеточного организма, но до деления клетка должна удвоить геном, чтобы дочерние клетки содержали ту же генетическую информацию, что и исходная клетка. Из нескольких теоретически возможных механизмов удвоения (репликации) ДНК реализуется полуконсервативный. Две цепочки разделяются, а затем каждая недостающая комплементарная последовательность ДНК воспроизводится ферментом ДНК-полимеразой. Этот фермент синтезирует полинуклеотидную цепь, находя правильный нуклеотид через комплементарное спаривание оснований и присоединяя его к растущей цепочке. ДНК-полимераза не может начинать новую цепь, а может лишь наращивать уже существующую, поэтому она нуждается в короткой цепочке нуклеотидов — (праймере), синтезируемом праймазой. Так как ДНК-полимеразы могут синтезировать цепочку только в направлении 5' --> 3', антипараллельные цепи ДНК копируются по-разному: одна цепь синтезируется непрерывно, а вторая прерывчато[66].

Взаимодействие с белками

Взаимодействие фактора транскрипции STAT3 с ДНК (показана в виде синей спирали)

Все функции ДНК зависят от её взаимодействия с белками. Взаимодействия могут быть неспецифическими, когда белок присоединяется к любой молекуле ДНК, или зависеть от наличия особой последовательности. Ферменты также могут взаимодействовать с ДНК, из них наиболее важные — это РНК-полимеразы, которые копируют последовательность оснований ДНК на РНК в транскрипции или при синтезе новой цепи ДНК — репликации.

Структурные и регуляторные белки

Хорошо изученными примерами взаимодействия белков и ДНК, не зависящего от нуклеотидной последовательности ДНК, является взаимодействие со структурными белками. В клетке ДНК связана с этими белками, образуя компактную структуру, которая называется хроматин. У прокариот хроматин образован при присоединении к ДНК небольших щелочных белков — гистонов, менее упорядоченный хроматин прокариот содержит гистон-подобные белки[67][68]. Гистоны формируют дискообразную белковую структуру — нуклеосому, вокруг каждой из которых вмещается два оборота спирали ДНК. Неспецифические связи между гистонами и ДНК образуются за счёт ионных связей щелочных аминокислот гистонов и кислотных остатков сахарофосфатного остова ДНК[69]. Химические модификации этих аминокислот включают метилирование, фосфорилирование и ацетилирование[70]. Эти химические модификации изменяют силу взаимодействия между ДНК и гистонами, влияя на доступность специфических последовательностей для факторов транскрипции и изменяя скорость транскрипции[71]. Другие белки в составе хроматина, которые присоединяются к неспецифическим последовательностям — белки с высокой подвижностью в гелях, которые ассоциируют большей частью с согнутой ДНК[72]. Эти белки важны для образования в хроматине структур более высокого порядка[73].

Особая группа белков, присоединяющихся к ДНК — это белки, которые ассоциируют с одноцепочечной ДНК. Наиболее хорошо охарактеризованный белок этой группы у человека — репликационный белок А, без которого невозможно протекание большинства процессов, где расплетается двойная спираль, включая репликацию, рекомбинацию и репарацию. Белки этой группы стабилизируют одноцепочечную ДНК и предотвращают формирование стеблей-петель или деградации нуклеазами[74].

В то же время другие белки узнают и присоединяются к специфическим последовательностям. Наиболее изученная группа таких белков — различные классы факторов транскрипции, то есть белки, регулирующие транскрипцию. Каждый из этих белков узнаёт свою последовательность, часто в промоторе, и активирует или подавляет транскрипцию гена. Это происходит при ассоциации факторов транскрипции с РНК-полимеразой либо напрямую, либо через белки-посредники. Полимераза ассоциирует сначала с белками, а потом начинает транскрипцию[75]. В других случаях факторы транскрипции могут присоединяться к ферментам, которые модифицируют находящиеся на промоторах гистоны, что изменяет доступность ДНК для полимераз[76].

Так как специфические последовательности встречаются во многих местах генома, изменения в активности одного типа фактора транскрипции могут изменить активность тысяч генов[77]. Соответственно, эти белки часто регулируются в процессах ответа на изменения в окружающей среде, развития организма и дифференцировки клеток. Специфичность взаимодействия факторов транскрипции с ДНК обеспечивается многочисленными контактами между аминокислотами и основаниями ДНК, что позволяет им «читать» последовательность ДНК. Большинство контактов с основаниями происходит в главной бороздке, где основания более доступны[22].

Ферменты, модифицирующие ДНК

Топоизомеразы и хеликазы

В клетке ДНК находится в компактном, т. н. суперскрученном состоянии, иначе она не смогла бы в ней уместиться. Для протекания жизненно важных процессов ДНК должна быть раскручена, что производится двумя группами белков — топоизомеразами и хеликазами.

Топоизомеразы — ферменты, которые имеют и нуклеазную, и лигазную активности. Они изменяют степень суперскрученности в ДНК. Некоторые из этих ферментов разрезают спираль ДНК и позволяют вращаться одной из цепей, тем самым уменьшая уровень суперскрученности, после чего фермент заделывает разрыв[47]. Другие ферменты могут разрезать одну из цепей и проводить вторую цепь через разрыв, а потом лигировать разрыв в первой цепи[78]. Топоизомеразы необходимы во многих процессах, связанных с ДНК, таких как репликация и транскрипция[48].

Хеликазы — белки, которые являются одним из молекулярных моторов. Они используют химическую энергию нуклеотидтрифосфатов, чаще всего АТФ, для разрыва водородных связей между основаниями, раскручивая двойную спираль на отдельные цепочки[79]. Эти ферменты важны для большинства процессов, где белкам необходим доступ к основаниям ДНК.

Нуклеазы и лигазы

В различных процессах, происходящих в клетке, например, рекомбинации и репарации, участвуют ферменты, способные разрезать и восстанавливать целостность нитей ДНК. Ферменты, разрезающие ДНК, носят название нуклеаз. Нуклеазы, которые гидролизуют нуклеотиды на концах молекулы ДНК, называются экзонуклеазами, а эндонуклеазы разрезают ДНК внутри цепи. Наиболее часто используемые в молекулярной биологии и генетической инженерии нуклеазы — это эндонуклеазы рестрикции (рестриктазы), которые разрезают ДНК около специфических последовательностей. Например, фермент EcoRV (рестрикционный фермент № 5 из 'E. coli') узнаёт шестинуклеотидную последовательность 5'-GAT|ATC-3' и разрезает ДНК в месте, указанном вертикальной линией. В природе эти ферменты защищают бактерии от заражения бактериофагами, разрезая ДНК фага, когда она вводится в бактериальную клетку. В этом случае нуклеазы — часть системы модификации-рестрикции[80]. ДНК-лигазы «сшивают» концы фрагментов ДНК между собой, катализируя формирование фосфодиэфирной связи с использованием энергии АТФ. Рестрикционные нуклеазы и лигазы используются в клонировании и фингерпринтинге.

ДНК-лигаза I (кольцеобразная структура, состоящая из нескольких одинаковых молекул белка, показанных разными цветами), лигирующая повреждённую цепь ДНК

Полимеразы

Существует также важная для метаболизма ДНК группа ферментов, которые синтезируют цепи полинуклеотидов из нуклеозидтрифосфатов — ДНК-полимеразы. Они добавляют нуклеотиды к 3'-гидроксильной группе предыдущего нуклеотида в цепи ДНК, поэтому все полимеразы работают в направлении 5'--> 3'[81]. В активном центре этих ферментов субстрат — нуклеозидтрифосфат — спаривается с комплементарным основанием в составе одноцепочечной полинуклеотидной цепочки — матрицы.

В процессе репликации ДНК ДНК-зависимая ДНК-полимераза синтезирует копию исходной последовательности ДНК. Точность очень важна в этом процессе, так как ошибки в полимеризации приведут к мутациям, поэтому многие полимеразы обладают способностью к «редактированию» — исправлению ошибок. Полимераза узнаёт ошибки в синтезе по отсутствию спаривания между неправильными нуклеотидами. После определения отсутствия спаривания активируется 3'--> 5' экзонуклеазная активность полимеразы, и неправильное основание удаляется[82]. В большинстве организмов ДНК-полимеразы работают в виде большого комплекса, называемого реплисомой, которая содержит многочисленные дополнительные субъединицы, например, хеликазы[83].

РНК-зависимые ДНК-полимеразы — специализированный тип полимераз, которые копируют последовательность РНК на ДНК. К этому типу относятся обратная транскриптаза, которая содержится в ретровирусах и используется при инфекции клеток, а также теломераза, необходимая для репликации теломер[84]. Теломераза — необычный фермент, потому что она содержит собственную матричную РНК[51].

Транскрипция осуществляется ДНК-зависимой РНК-полимеразой, которая копирует последовательность ДНК одной цепочки на мРНК. В начале транскрипции гена РНК-полимераза присоединяется к последовательности в начале гена, называемой промотором, и расплетает спираль ДНК. Потом она копирует последовательность гена на матричную РНК до тех пор, пока не дойдёт до участка ДНК в конце гена — терминатора, где она останавливается и отсоединяется от ДНК. Также как ДНК-зависимая ДНК-полимераза человека, РНК-полимераза II, которая транскрибирует большую часть генов в геноме человека, работает в составе большого белкового комплекса, содержащего регуляторные и дополнительные единицы[85].

Генетическая рекомбинация

Рекомбинация происходит в результате физического разрыва в хромосомах (М) и (F) и их последующего соединения с образованием двух новых хромосом (C1 и C2)

Двойная спираль ДНК обычно не взаимодействует с другими сегментами ДНК, и в человеческих клетках разные хромосомы пространственно разделены в ядре[86]. Это расстояние между разными хромосомами важно для способности ДНК действовать в качестве стабильного носителя информации. В процессе рекомбинации с помощью ферментов две спирали ДНК разрываются, обмениваются участками, после чего непрерывность спиралей восстанавливается, поэтому обмен участками негомологичных хромосом может привести к повреждению целостности генетического материала.

Рекомбинация позволяет хромосомам обмениваться генетической информацией, в результате этого образуются новые комбинации генов, что увеличивает эффективность естественного отбора и важно для быстрой эволюции новых белков[87]. Генетическая рекомбинация также играет роль в репарации, особенно в ответе клетки на разрыв обеих цепей ДНК[88].

Самая распространённая форма кроссинговера — это гомологичная рекомбинация, когда принимающие участие в рекомбинации хромосомы имеют очень похожие последовательности. Иногда в качестве участков гомологии выступают транспозоны. Негомологичная рекомбинация может привести к повреждению клетки, поскольку в результате такой рекомбинации возникают транслокации. Реакция рекомбинации катализируется ферментами, которые называются рекомбиназы, например, Cre. На первом этапе реакции рекомбиназа делает разрыв в одной из цепей ДНК, позволяя этой цепи отделиться от комплементарной цепи и присоединиться к одной из цепей второй хроматиды. Второй разрыв в цепи второй хроматиды позволяет ей также отделиться и присоединиться к оставшейся без пары цепи из первой хроматиды, формируя структуру Холлидея. Структура Холлидея может передвигаться вдоль соединённой пары хромосом, меняя цепи местами. Реакция рекомбинации завершается, когда фермент разрезает соединение, а две цепи лигируются[89].

Эволюция метаболизма, основанного на ДНК

ДНК содержит генетическую информацию, которая делает возможной жизнедеятельность, рост, развитие и размножение всех современных организмов. Однако как долго в течение четырёх миллиардов лет истории жизни на Земле ДНК была главным носителем генетической информации, неизвестно. Существуют гипотезы, что РНК играла центральную роль в обмене веществ, поскольку она может и переносить генетическую информацию, и осуществлять катализ с помощью рибозимов[90][91][92]. Кроме того, РНК — один из основных компонентов «фабрик белка» — рибосом. Древний РНК-мир, где нуклеиновая кислота была использована и для катализа, и для переноса информации, мог послужить источником современного генетического кода, состоящего из четырёх оснований. Это могло произойти в результате того, что число оснований в организме было компромиссом между небольшим числом оснований, увеличивавшим точность репликации, и большим числом оснований, увеличивающим каталитическую активность рибозимов[93].

К сожалению, древние генетические системы не дошли до наших дней. ДНК в окружающей среде в среднем сохраняется в течение 1 миллиона лет, а потом деградирует до коротких фрагментов. Извлечение ДНК из бактериальных спор, заключённых в кристаллах соли 250 млн лет назад, и определение последовательности генов 16S рРНК[94], служит темой оживлённой дискуссии в научной среде[95][96].

См. также