|
|
Самоорганизация материи и эволюция биологических макромолекулусловий, в которых она возникла, и преобразовать среду на собственную пользу. § 1.2. Предпосылки самоорганизации 1.2.1. Эволюция должна начинаться со случайных событий. «В начале» — каков бы ни был точный смысл этого понятия — по-видимому, имелся молекулярный хаос, и в гигантском многообразии химических соединений не было никакой функциональной организации. Таким образом, самоорганизация материи, которую мы связываем с «возникновением жизни», должна была начаться со случайных1 событий. Из этого утверждения нельзя, однако, сделать вывод, что какие-либо, пусть даже примитивные, организмы, существующие в настоящее время, могли возникнуть в результате случайной сборки. 1 Термин «случайный» относится, конечно, к отсутствию функциональной организации, а не к отсутствию физических (т. е. атомных, молекулярных или даже надмолекулярных) структур. Несколько лет назад Е. Вигнер [16] написал статью «Вероятность существования самовоспроизводящейся системы», в которой он в неявной форме высказал подобное предположение. Суть его рассуждений сводится к следующему. Допустим, что состояние «живого существа», а также состояния веществ, которыми оно питается, и состояние продуктов его метаболизма полностью заданы в квантовомеханическом смысле, т. е. могут быть описаны векторами в гильбертовом пространстве. Тогда, процесс воспроизведения, т. е. взаимодействие организма с питательной средой, приводящее к редупликации организма, описывается преобразованием, в которое входит унитарная «матрица столкновениям S. Если предположить, что S — случайная матрица, то оказывается, что число уравнений, задающих это преобразование, значительно превосходит число неизвестных (т. е. компонентов векторов); при этом избыток равен разности N2R — (N + R + NR), где N и R — любые большие числа. Фактически для - любого реального случая N и R настолько велики, что, как правильно заключает Вигнер, «было бы чудом», если бы уравнения преобразования выполнялись для какого-то набора неизвестных (утверждение, которое остается справедливым также и в том случае, если живому организму соответствует много альтернативных состояний). 1 В мои намерения не входило обсуждать здесь определенные трудности применения квантовой механики для описания «макроско* Однако все это рассуждение, основано на предположении, что S действительно является существенно случайной матрицей и, следовательно-, взаимодействие не «инструктировано», т. е. вероятность любого данного состояния ничтожно мала по сравнению с большим числом "возможных состояний. Этот результат может привести только к заключению, что никакое сложное состояние материи, которое мы теперь называем живым, не может возникнуть в результате случайной сборки. Наличие инструктирования на молекулярном уровне, означающее, что матрица преобразования S должна иметь очень специальный вид, может потребовать приспособления статистической механики к описанию процессов отбора и эволюции, но это вовсе не означает, «что современные законы и понятия квантовой механики необходимо модифицировать, прежде чем их можно будет применить к проблеме жизни» [16]1, 1.2.2. Инструкция требует информации. Я думаю, что именно Норберт Винер впервые предложил рассматривать информацию как новую физическую переменную. Мы имеем в своем распоряжении развитую теорию информации, начало которой положили работы Дж. фон Неймана, Н. Винера, К. Шеннона и других (литературу см. [17, 18]). Не можем ли мы воспользоваться этой теорией для решения интересующей нас проблемы самоинструктирования? Теория информации в современном понимании — это в основном теория связи. Она имеет дело с проблемами переработки, а не «генерации» информации. Она требует, чтобы информация была задана с самого начала во вполне определенной форме. Только после этого теория может сказать нам, как закодировать сообщение и как использовать избыточность; она может также сказать нам, как согласовать сообщение с возможностями перерабатывающих устройств, чтобы передать его через каналы с шумом, отфильтровать шум и восстановить сообщение с помощью устройств, сверяющих код; однако ей всегда требуется кто-то — обычно человек, чтобы с самого начала определить, что считать «информацией» и что «бессмыслицей». Это обстоятельство отражено уже в самом определении информации. В простейшем случае, если мы хотим отобрать ситуацию с Z\ событиями из Z0 исходных событий, имеющих равную априорную вероятность, то для того, чтобы свести Z0 возможностей к Zu необходимо следующее количество информации: /^/CMZq/ZJ. (1.1) Если мы хотим отобрать одно определенное событие, т. е. Z\ — 1, нужное количество информации равно I = K\nZQ. (1.2) Это — определение. Оно выбрано таким образом, чтобы превратить совместные вероятности (которые пических процессов». Эти трудности возникают и при рассмотрении других хорошо известных физических процессов, которые не связаны с феноменом жизни. На это обстоятельство обратил мое внимание X, Примас, всегда являются мультипликативными комбинациями вероятностей отдельных независимых событий) в аддитивные величины. Так, если Z0 — число-всех последовательностей длиной v из X различных единиц, то мы имеем Zq = X и IKv = Kv ЫЬ. (1.3) Константа К выбрана в соответствии с двоичным кодом, т. е. К — 1/1п 2. Следовательно, если Я — 2, то / равняется полному числу v двоичных единиц («битов») в сообщении. Таблица 2 Генетический код Продолжение табл. 2 Каждая аминокислота (обозначенная начальными буквами) кодируется триплетом, составленным из оснований У, Ц, А, Г. С первого взгляда заметна существенная вырожденность в каждой клетке таблицы, указывающая на меньшее значение третьей буквы в триплете. (Подробности о замещениях в третьем положении — см. гипотезу «виляний» (гипотеза неоднозначного соответствия) Крика [22].) Заметно также некоторое сходство аминокислот в одном и том же столбце, что говорит о важном значении второй буквы. Триплеты, содержащие только У и А, дают большее число функциональных аминокислот (Фен, Лей, Тир, Иле, Асн, Лиз плюс 1 сигнал), чем триплеты, содержащие только Г и Ц (Про, Apr, Ала, Гли). Все эти факты могут содержать определенную информацию о возникновении кода и должны учитываться при построении различных теорий. Хотя код, по всей вероятности, универсален, следует оговорить, что эти соответствия (особенно «сигналы») относятся к Е. coli. Сокращенные обозначения аминокислот: Ала — аланин Мет — метионин!) (формилметионин) Apr — аргинин Про — пролин Асн — аспарагин Сер — серии Асп — аспарагиновая кислота Тре — треонин Вал — валин ') Три — триптофан Гис — гистидин Тир — тирозин Гли — глицин Фен — фенилаланин Глн — глутамин Цис - цистейн Глу — глутаминовая кислота Терм. — •сигнал терминации Иле — изолейцин ') Триплеты ДУГ и ГУГ означают «начало цепи», т. е. формил-Мет, если они стоят в начале цистрона; внутри цистроиа они означают Мет или Вал соответственно. Итак, количество информации в последовательности из п нуклеотидов (К = 4) составляет 2п битов. Трансляция нуклеотидного кода в ,аминокислотный (Я = 20) требует, чтобы единицами кодирования служили по меньшей мере триплеты. Кодирование триплетами допускает также некоторую избыточность и сигналы старта и терминации. Генетический код (табл. 2), который мы рассмотрим более подробно в гл. VI, в настоящее время полностью выяснен, в основном благодаря работам Г. Корана, X. Маттеи, М. Ниренберга, С. Очоа и их сотрудников (см. [19—21]). Табл. 3 очень ярко демонстрирует гигантскую информационную емкость биологических макромолекул. Вероятность воспроизводимого нахождения при любых Таблица 3 Из v единиц с базисом t можно составить всего JV^V = V последовательностей: Примеры А, Небольшие субъединицы природных 20 100 10130 белков (с мол. весом 12 000) Полипептиды, которые кодируются 6 100 io78 только с помощью А и У (см. табл. 2) Цепи ДНК» кодирующие 33 амино- 4 99 кислоты АУ-сополимеры, кодирующие 33 ами- 2 99 10зо нокислоты, которым соответствуют ко- доны класса АУ Олигопептиды, содержащие любые 12. 20 12 4- 1015 из 20 природных аминокислот Олигопептиды, содержащие 20 амино- 6 20 4- 1015 кислот, которым соответствуют кодоны класса АУ
Для сравнения: число молекул белка с мол. весом 104: а) предполагая плотную упаковку во всей Вселенной 10103 в слое толщиной 1 м, покрывающем всю 2-1040 поверхность Земли в 1 м3 6* Ш25 б) в 10 М растворе (что соответствует «бульону» с достаточно большой вязкостью) в Мировом океане 1042 в пруду (ЮОХЮО м, глубина 10 м) 6-1028 в луже (1 л) 6-102° Напомним, что молекулярные веса большинства природных белков и нуклеиновых кислот значительно больше, чем в приведенных примерах. Отметим далее, что возраст Земли равен «всего лишь» 1017 с, так что, даже предположив быстрый круговорот молекул белков, нельзя было бы перебрать все возможные последовательности (время жизни и продолжительность сборки каждой молекулы безусловно больше 1 с). Приведены только порядки величин. Вселенную представляем в виде сферы с диаметром 10 млрд световых лет; «плотной упаковкой» считается заполнение пространства с плотностью 1 г/см.3. разумных условиях (т. е. в объемах, имеющих разумные размеры), любой заданной последовательности из набора случайных последовательностей практически близка к нулю даже для относительно коротких цепей; А между тем такие последовательности не могут содержать сколько-нибудь значительного количества информации. С другой стороны, вся информация, содержащаяся в цепочках ДНК хромосом весьма сложного живого существа, может превышать 1010 битов, что соответствует выбору одной возможности из I03#1°9 таких возможностей. Делались попытки сопоставить подобные числа с информацией, содержащейся в тех структурах и функциях, которые кодирует ДНК. В дальнейшем будет показано, что это невозможно, если не учитывать среду и историю данного существа. Информация, накопленная в процессе эволюции, — это «оцененная» информация, и число битов мало что говорит о ее |
[каталог] [статьи] [доска объявлений] [обратная связь] |