20-х годах ХХ века Эдвин Хаббл открыл зависимость относительной скорости движения галактик от расстояния между ними. Более далекие галактики разбегаются быстрее. Эти наблюдения позволили нам лучше понять возникновение и эволюцию Вселенной.
Оказывается, определенную аналогию этого явления можно обнаружить и в эволюции биологической вселенной. Белки движутся друг относительно друга в пространстве аминокислотных последовательностей. Как это происходит, описывается в работе Инны Поволоцкой и Фёдора Кондрашова из испанского Центра геномной регуляции в Барселоне [1].
Причиной движения галактик является Большой взрыв, а белки движутся благодаря мутациям. Каждая мутация может привести к изменению одной аминокислоты из сотен, составляющих белок, в результате белковая последовательность «перепрыгнет» в соседнюю точку пространства. Два десятка различных аминокислот, используемых для построения белков большинством известных организмов, дают размер пространства ~20500 для последовательности из 500 элементов. Расстояние между белками в этом пространстве можно определить как число позиций последовательности, в которых аминокислоты не совпадают. Направление движения между двумя белками, имеющими общего предка, определяется путем подсчета (по отдельности) количеств аминокислотных замен, сближающих (Nt) и разводящих (Na) выбранные последовательности. Отношение сближающих и разводящих замен показывает направление и скорость движения последовательностей друг относительно друга. Если Nt/ Na > 1, то белки сближаются, если < 1 — расходятся. В работе были проанализированы данные о последовательностях 572 групп белков, берущих свое начало в общем предке всех организмов, жившем более 3,5 млрд лет назад. Оказалось, что биологический закон разбегания белков противоположен космологическому закону разбегания галактик — чем дальше белки находятся друг от друга, тем медленнее они расходятся (рис. 1, синие и зеленые точки). Какое явление отражает эта зависимость? Если бы на движение белков не влиял отбор, то количество сближающих и разводящих замен было бы примерно равно практически во всем диапазоне расстояний. Это можно проверить, померяв движение белков только по синонимичным заменам нуклеотидов, то есть по заменам в последовательности ДНК, не приводящим к изменению кодируемых ими аминокислот, а значит и функции белка. И, действительно, по синонимичным заменам N/Na и 1 (рис. 1, оранжевые точки). Поэтому логично предположить, что на закон разбегания последовательностей влияет отбор, который может действовать на аминокислоты независимо в отдельных позициях или сразу на их комбинации. Последний случай в эволюционной биологии называется эпистаз.
Чтобы детальнее проверить гипотезу эпистатического отбора, были рассмотрены две группы позиций сравниваемых последовательностей — «дивергентные» и «конвергентные». Дивергентные позиции — это позиции в последовательности, любая мутация в которых приведет к расхождению белков. Конвергентные — позиции, которые могут сблизить белки, если в них произойдет мутация. Для обеих групп была посчитана доля накопленных замен по отношении к синонимичным заменам, что дает значение скорости накопления эволюционных изменений. Результаты анализа показали, что замены в дивергентных позициях составляют ~2% от нейтральных. Следовательно, эти аминокислоты с большой вероятностью критичны для нормального функционирования белка. Таким образом, отбор «тормозит» движение белков по дивергентным позициям. С другой стороны, конвергентные позиции являются направлениями для потенциального сближения последовательностей. В таких позициях аминокислоты в разных последовательностях разные, и с адаптивностью белка они могут быть совсем не связаны, так как если аминокислота присутствует в белке у одного вида, то она может присутствовать без отрицательных влияний и у другого вида. В этом случае скорость их эволюции не будет зависеть от расстояния между белками. Тем не менее, расчет скорости эволюции конвергентных позиций показал, что она быстро уменьшается с увеличением расстояния между сравниваемыми белками. Такая зависимость должна наблюдаться, если функция белка зависит не только от консервативных позиций, но и от комбинаций аминокислот в части остальных позиций последовательности. Подобных «теневых» комбинаций, опосредованно влияющих на адаптивность, может быть несколько. Тогда, если одна замена, ведущая к альтернативной комбинации, все же произошла, за ней должны быстро последовать другие, чтобы белок приобрел новую устойчивую структуру, после чего его эволюция опять замедляется. В этом случае при дивергенции альтернативных вариантов белка в процессе эволюции в них «попадают» разные комбинации, что и приводит к снижению скорости изменений в конвергентных позициях. Поэтому белки на большом расстоянии будут разбегаться медленнее.
Галактики разлетаются от точки возникновения физической Вселенной, а в белковой вселенной всё гораздо запутаннее. Белки не бегут по кратчайшей траектории от точки к точке пространства аминокислотных последовательностей (рис. 2а). За счет взаимодействия между аминокислотами, образующими белок, на каждом шаге одни размерности пространства закрываются, а другие открываются для последующего перемещения. Путь движения становится изрезанным, и альтернативные варианты белка просачиваются по тонким проходам, пронизывающим области с низкой адаптивностью (рис. 2б).
Михаил Бурцев
1. Povolotskaya, Inna S., и Fyodor A. Kondrashov. 2010. Sequence space and the ongoing expansion of the protein universe. Nature (online 19 May 2010). doi:10.1038/nature09105.
2. Hubble, Edwin. 1929. A Relation Between Distance And Radial Velocity Among Extra-Galactic Nebulae. PNAS 3 (15): 168-173.