ГЕНЫ

Основными объектами генно-инженерных операций являются гены — участки ДНК или РНК, детерминирующие последовательность мономерных звеньев в кодируемых ими полипептидах или полинуклеотидах. В генетической инженерии обычно манипулируют генами, кодирующими полипептиды (белки), поэтому здесь не будут рассматриваться гены, которые определяют синтез рРНК или тРНК.

За последние годы представления о структуре генов заметно усложнились. На раннем этапе развития молекулярной генетики предполагалось, что гены состоят из непрерывной кодирующей последовательности нуклеотидов. Однако позднее выяснилось, что большинство генов эукариот и некоторые прокариотические гены имеют мозаичное строение — в них чередуются кодирующие и некодирующие области. Поэтому они значительно длиннее, чем это требуется для кодирования белков заданной длины. Например, ген дигидрофолатредуктазы мыши включает 32 тысячи пар нуклеотидов (т.п.н.), в то время как его кодирующая область — только 568 пар нуклеотидов (п.н.). Считалось также, что гены в ДНК занимают фиксированное положение. Теперь же выявлено много "блуждающих" генов и даже их групп.

Информация, содержащаяся в генах, записана в виде генетического кода. У всех организмов, за исключением некоторых ко-донов у ресничных простейших и в митохондриях, он одинаков. Одинаковы у всех клеток и принципы реализации генетической информации. В структуре любого гена запрограммированы два основных этапа его экспрессии. На этапе транскрипции с помощью РНК-полимеразы синтезируется мРНК. Нуклеотидные последовательности, благодаря которым РНК-полимераза связывается с ДНК (промоторы) и отсоединяется от нее (терминаторы транскрипции), располагаются в начале и конце генов, соответственно. На этапе трансляции осуществляется синтез белка. Генетические сигналы, обусловливающие этот процесс, также заложены в структуре генов: в начале и конце их белок-кодирующих областей расположены инициирующие и терминирующие кодоны.

Несмотря на принципиальное сходство этих этапов у всех организмов, структура генов и их регуляторных элементов, а также строение аппаратов транскрипции и трансляции у про- и эукариот существенно различаются.

Основные молекулярно-генетические сведения, касающиеся прокариот, получены при изучении клеток Escherichia coli. Транскрипция. Индивидуально работающий ген прокариот состоит из трех обязательных элементов: промотора, белок-кодиру-ющей области и терминатора транскрипции . Координаты транскрибируемых нуклеотидов принято записывать с положительным знаком, а нуклеотидов промоторов — с отрицательным. Отсчет нуклеотидов в генах ведут от первого транскрибируемого нуклеотида, обозначаемого +1.

Транскрипцию у бактерий ведет общая для всех генов РНК-полимераза, состоящая из 5 субъединиц: двух а и по одной (3, (3' и а. Распознавание промоторов РНК-полимеразой осуществляется с помощью ее а-субъединицы. У клеток Е. coli известно 6 различных а-субъединиц и, соответственно, 6 разных типов промоторов. Они используются для дифференцированной транскрипции определенных групп генов, имеющих промоторы сходного строения. Субъединица а70 (цифровой индекс обозначает ее массу в кило-дальтонах) участвует в транскрипции подавляющего большинства генов, другие а-субъединицы — в специальных случаях.

Все промоторы имеют две консервативные последовательности. Одна из них необходима для узнавания, а другая — для тесного связывания промотора с РНК-полимеразой. В стандартном промоторе, распознаваемом субьединицей а70, первая последовательность с консенсусом TTGACA (здесь и далее последовательность нуклеотидов указывается в направлении 5 '—>3') центрируется около координаты -35, а вторая (консенсус ТАТААТ) — около отметки -10 от старта транскрипции. Положения обеих последовательностей в стандартных промоторах несколько различаются, но в