Парк юрского периода: открытие откладывается?

Череп Tyrannosaurus rex, Palais de la Decouverte, Paris. Фото DaWd Monniaux с сайта Wikipedia. org
Череп Tyrannosaurus rex, Palais de la
Decouverte, Paris.
Фото DaWd Monniaux с сайта Wikipedia.org

Во втором номере ТрВ была опубликована небольшая новостная заметка об изучении белков, выделенных из кости тираннозавра. Мы решили разобраться в этом подробнее, и вот что оказалось.

Эта история берет начало в 1997 году, когда группа исследователей из Университета штата Монтана использовала новейшие физические методы, чтобы обнаружить следы гема (вещества, которое входит в состав гемоглобина) в костях тираннозавра – пожалуй, самого известного из динозавров, – и опубликовала статью в престижном журнале Proceedings of the National Academy of Sciences of the USA (PNAS). Но гем – это относительно простое вещество. Настоящий же успех пришел через несколько лет. Сначала Мэри Швейцер (Mary T. Schweitzer), теперь уже из Университета штата Северная Каролина, и ее монтановский соавтор Джон Хорнер (John T. Horner) показали, что если аккуратно растворить минеральную фракцию костей тираннозавра, то можно будет увидеть микроскопические кровеносные сосуды, сохранившие эластичность, а в них – следы клеток (статья в Science в 2005 г.). А еще через некоторое время, в апреле 2007 года, Мэри Швейцер и ее коллеги опубликовали сразу две статьи в одном номере того же Science, в которых с использованием тандемной масс-спектрометрии реконструировали последовательности нескольких фрагментов коллагена (основного белка соединительной ткани) 68-миллионолетнего тираннозавра и несколько десятков фрагментов различных коллагенов мастодонта – ископаемого родственника слонов и мамонтов, которому было «всего» несколько сотен тысяч лет.

Казалось бы, это несомненный успех. Пресса, разумеется, сразу же вспомнила про «Парк Юрского периода», соответствующие заголовки запестрели и в Интернете. Но коллеги были настроены более скептично. Одно за другим стали появляться сообщения, в которые критиковались те или иные аспекты этих исследований.

Дело вот в чем. Масс-спектрометрия позволяет определить не сами последовательности, а лишь массы коротких пептидов. Для того, чтобы узнать последовательность, исходный пептид дробится на более мелкие (каждая молекула при этом разбивается на две, префикс и суффикс, причем точка разрыва может быть где угодно), и определяются массы этих фрагментов. Получается набор масс (спектр). Если бы он был известен совершенно точно, то последовательность можно было бы восстановить, просто упорядочив массы по возрастанию и посмотрев, каким аминокислотам соответствуют разности масс соседних фрагментов. На самом деле, уже здесь не все так просто, поскольку наблюдаемый спектр – это комбинация масс всевозможных префиксов и суффиксов данного пептида. Но эту задачу можно решить вычислительно.

Существенно другое. Масс-спектрометрия применяется именно тогда, когда хочется избежать тщательной очистки исходного образца или она просто невозможна – поэтому на выходе получается суперпозиция спектров всех имеющихся в смеси пептидов плюс массы других веществ, присутствующих в образце. Кроме того, в процессе дробления на фрагменты с пептидами происходит множество дополнительных изменений, например, отваливаются отдельные химические группы аминокислот. Массы таких измененных фрагментов тоже зашумляют спектр. Ну и, наконец, пики на спектрограмме, соответствующие массам фрагментов, бывают разной высоты, потому что, в частности, концентрации фрагментов различаются.

Поэтому во многих приложениях получившиеся спектры просто сравнивают с уже известными белками – это и есть процесс интерпретации. Если в данных есть набор масс, который соответствует фрагменту известного белка, значит, этот белок присутствовал в смеси. Это совпадение не обязано быть точным. Поскольку основные модификации аминокислот – природные или случившиеся в процессе дробления – тоже известны, то ясно, как они должны влиять на массу фрагмента, и мы можем это учесть при сравнении. Кроме того, мы можем допустить существование аминокислотных замен и сделать вывод, что белок в образце не тождественен, а лишь родственен известному.

И действительно, семь пептидов, идентифицированных авторами как фрагменты коллагена тираннозавра, оказались похожи на коллагены птиц (курицы и страуса), но содержали небольшие отличия и некоторое количество модифицированных аминокислотных остатков. Это соответствовало ожиданиям – птицы (и крокодилы) являются потомками динозавров и, соответственно, ближайшими ныне живущими родственниками тираннозавра.

Все это сыграло роль при внимательном анализе результатов статьи. Сначала, в сентябре 2007 года, сами авторы опубликовали короткое письмо, в котором отказались от некоторых из своих интерпретаций, – в частности, одна из принятых ими модификаций (дегидратация глицина) оказалась невозможной из биохимических соображений.

В январе 2008 года в Science было опубликовано письмо большой группы исследователей, в котором критиковалась методика эксперимента. В частности, было указано, что приведенные в статье данные об иммуно-гистохимическом анализе, использованном для выделения белка из костей тираннозавра, неполны, авторы не рассмотрели часть возможных модификаций аминокислот, а филогенетический анализ не дает оснований для каких-то конкретных выводов.

Параллельно палеонтологи стали выражать сомнение в том, что обнаруженные структуры – это действительно кровеносные сосуды. Споры начались на конференциях еще в 2006 году, а статья, в которой при помощи сканирующего электронного микроскопа и углеродной датировки было показано, что аналогичные структуры во многих ископаемых костях разного возраста являются следами современных бактериальных биопленок, была опубликована в журнале PLoS ONE в июле 2008 г.

Наконец, еще одно письмо в Science, опубликованное в августе 2008 г. , подвергло сомнению статистические процедуры, использованные при анализе спектров. Авторы указывают, что если сравнить несколько сотен тысяч спектров с банком данных объемом в миллиарды символов, то несколько совпадений должно появиться просто по случайным причинам. А на фоне этой полемики в апреле 2008 г. Science опубликовал очередную заметку Мэри Швейцер с соавторами, на этот раз посвященную эволюционному анализу полученных ими последовательностей.

Сложилась парадоксальная ситуация. Критикам-биохимикам и масс-спектрометристам авторы отвечают, ссылаясь на палеонтологические и филогенетические соображения. Критикам-биоинформатикам – на биохимию и палеонтологию. Палеонтологам – на интерпретацию масс-спектрометрических данных. В то же время сами эти данные недоступны, и потому никто не может провести независимого анализа. А без него открытие парка Юрского периода откладывается, если не отменяется.

Михаил Гельфанд

Post scriptum: В начале сентября, когда этот материал и интервью профессора Певзнера были уже подготовлены к печати, пришло сообщение, что все 48 тысяч массспектров из кости тираннозавра выложены в Интернет и доступны для анализа. Мы вернемся к этой теме, когда появятся первые результаты.

12_pevznerТрВ (в лице Михаила Гельфанда) обсудил ситуацию с автором одного из писем в Science, профессором Калифорнийского университета в СанДиего Павлом Певзнером.

ПП: С тираннозавром вышла такая история. Это типичная спекулятивная наука, когда печатается статья, которая не прошла бы в уважающий себя профессиональный журнал. Я был ее рецензентом. Я написал, что статью нельзя даже рецензировать в таком виде. Авторы сначала должны предоставить исходные данные, сделать серьезный статистический анализ, и только после этого статью можно будет всерьез рецензировать. Но это мнение проигнорировали.

ТрВ: А сколько всего было рецензентов?

ПП: Четыре, включая меня.

ТрВ: И ее опубликовали, несмотря на такой отзыв. Зато, наверно, ссылок на нее много.

ПП: Да. В одном из рейтингов она считалась самым значительным открытием в науке за прошлый год. Ну и, конечно, она облетела мир со страшной скоростью, была на всех каналах… Мало того, что они выделили белок тираннозавра, они еще решили такую большую эволюционную проблему, они показали, что тираннозавр близок к курице.

ТрВ: Так ведь любой динозавр должен быть ближе к птицам, чем к кому-либо еще. Кстати, а с крокодилом они сравнивали?

ПП: Ну вот видишь, ты уже задаешь вопросы. И беседа сразу становится абсурдной. Не сравнивали. Последовательности коллагена крокодила тогда не было, была курица и, кажется, страус.

Дело не в этом. Нечего там сравнивать, нет ничего. Последовательности, которые они нашли, – мифические.

ТрВ: А они опубликованы? Стало быть, не совсем мифические. Они похожи на коллаген курицы?

ПП: Они похожи на что угодно. Там очень хитрая история, каким образом они сравнивали. Если взять большую коллекцию спектров и начать ее сравнивать с большим количеством белков, в конце концов, найдутся последовательности, которые что-то объясняют в этих спектрах.

ТрВ: Но ведь их спектры оказались ближе к птицам, как и должно быть. Не к лягушке, не к рыбе, не к млекопитающим…

12_pevzner-saurusrexПП: Сравнили бы с лягушкой – было бы что-то из лягушки.

ТрВ: Но это ведь чисто технический вопрос. Была формальная процедура сравнения спектров с последовательностями, и потом уже оказалось, что получились последовательности из курицы, или же там в процессе работы было большое подкручивание винтиков? Основной их довод – что получились последовательности, похожие на курицу, но не точно. Стало быть, по эволюционным соображениям это родственник птиц, и при этом не загрязнение птичьим материалом. Значит, тираннозавр.

ПП: А это не известно. Если бы спектры были опубликованы, можно было бы понять.

ТрВ: А они недоступны?

ПП: Изначально, когда статья только вышла, не было доступно вообще ничего. Я думаю, если бы мы не писали слезные письма в Science о том, что эти спектры необходимо опубликовать, ничего бы и не было. В конце концов, через месяц после того, как статья вышла, они опубликовали семь спектров – только те, которые они относят к тираннозавру.

ТрВ: А остальные сто тысяч, которые они не относят, проверить невозможно?

ПП: Да. В таких случаях нельзя публиковать только семь спектров, нужно публиковать все. До сих пор не было примера публикации масс-спектрометрического эксперимента, когда из ста тысяч спектров выбираются семь. Это уникальная ситуация. Обычно выбирают, ну, скажем, десять процентов.

ТрВ: Но ведь тут особый случай, это сильно деградированные белки.

ПП: Неясно, есть ли там вообще какие-то белки. Основное, о чем я говорю, – нужно опубликовать данные. Я дважды писал в Science. Сначала письмо, которое опровергало эту статью. Мы показали, даже с этими семью спектрами, что они в равной степени похожи на белки курицы, человека, бактерии, кого угодно. Это письмо не стали публиковать, и я про него забыл. Потом, где-то в декабре, ко мне приехал специалист по масс-спектрометрии Фил Эндрюс (Phillip Andrews. – ТрВ) и сказал: «А ты не слышал, что в сентябре они опубликовали поправку и признали, что один из семи спектров имеет низкую статистическую значимость». Это как раз то, о чем мы писали в своем письме. И он же рассказал, что собралась группа из двадцати семи экспертов, масс-спектрометристов, специалистов по динозаврам, биоинформатиков, еще кого-то, и, в конце концов, после многочисленных усилий у них приняли письмо в Science о том, что все это туфта. На что те ответили что-то невнятное и сделали вид, что ничего не произошло.

Тогда я вернулся к своему письму. Я писал и бывшему главному редактору Science и нынешнему, Брюсу Альбертсу (Bruce Alberts. — ТрВ), и, наконец, с его поддержкой мое письмо тоже вышло. Причем в какой-то момент они мне сказали: «Ну хорошо, мы готовы это напечатать, но, пожалуйста, перепишите это в серьезном тоне». А у меня было не вполне серьезно, там был пример обезьяны, которая печатает на пишущей машинке, и тому подобное. Тут я уперся и ответил, что никак не могу принять серьезный тон, потому что насколько серьезная была оригинальная статья, настолько серьезное должно быть и письмо.

ТрВ: Ну хорошо. А они сами верят в этот результат?

ПП: Трудно сказать.

ТрВ: Что делается в голове у человека, который такое публикует? Может быть, они хотели опубликовать это побыстрее как что-то предварительное, а потом, что называется, развить успех?

ПП: Дело в том, что, если бы им удалось продолжать придерживать спектры у себя, эту статью невозможно было бы критиковать.

ТрВ: А журнал не требует публикации исходных данных?

ПП: Не очень понятно. Спектры — это не последовательности, которые обязательно публиковать, это такая серая область… А последовательности, которые, как они считают, относятся к тираннозавру, опубликованы, с этим все в порядке.

И еще одна подозрительная вещь. После критики они убрали один пептид, подкорректировали другие, и теперь все шесть остающихся пептидов идентичны белкам курицы.

ТрВ: То есть это просто загрязнение? Протекло что-то… Голубь мимо форточки пролетал…

ПП: Наверно, еще проще. Они для выделения белка использовали антитела курицы.

ТрВ: Курицы — это потому что ближайший родственник динозавров, можно было надеяться, что чувствительность будет выше?

ПП: По-видимому, да.

ТрВ: И антитела были не очень чистые?

ПП: Антитела всегда не очень чистые, если потом масс-спектрометрию делать.

ТрВ: А от кости, с которой они работали, ничего не осталось?

ПП: Ну, если они спектры не показывают, то кость-то точно не дадут. А если спектры показать, все в них начнут копаться. Там окажутся и коллагены не из курицы, и другие белки, не коллагены, из курицы.

ТрВ: А что, они сами другие пептиды из курицы не видели, когда спектры с последовательностями сравнивали? Из этого же сразу бы следовало загрязнение.

ПП: Об этом они не говорят.

ТрВ: Ну подумать-то они об этом подумали? Я все пытаюсь понять психологию во всей этой истории.

ПП: Дело в том, что такая статья делает научную карьеру. Я слышал, что в 2004 году Мэри Швейцер не получила тенюр (постоянную должность. — ТрВ) в Университете Северной Каролины. А когда нашла белки динозавра, получила.

ТрВ: Даже если статья сопровождается скандалом? А репутация?

ПП: Что важнее, тенюр или репутация?

На самом деле, как я подозреваю, это была просто ошибка. Понятно, что динозавровые люди невежественны в вычислительных вопросах. Но многие масс-спектрометристы — тоже невежественны. И, помимо этого, долго не было никаких стандартов, как интерпретировать масс-спектрометрические данные, как устанавливать, что белок там есть. Только в последние три года появился такой стандарт. Сейчас масс-спектрометрия превратилась в очень точную науку. Но до сих пор многие этому не следуют. Об этом я и написал в рецензии в Science.

Более того, программа, которой они пользовались, Sequest, известна тем, что с ее помощью невозможно вычислить статистическую значимость. Поэтому они, скорее всего, просто обманулись, а теперь уже деваться некуда. Теперь всё надо отстаивать и пытаться в данных какие-то дополнительные доводы искать.

ТрВ: А мастодонт у них правильный?

ПП: Мастодонта я даже не смотрел. У него выделяют ДНК, почему бы ни быть белку? Но если они данные выложат, я с удовольствием посмотрю. Пока что и смотреть нечего.

Сейчас непонятно, что с этим делать, как их заставить выложить данные. У Science есть такой механизм, expression of editorial concern (выражение редакторской озабоченности. — ТрВ). Я хочу написать Брюсу Альбертсу, что пришло время или попросить их выложить данные, или выразить озабоченность.

Журнал тут тоже странно себя ведет. Уже было известно, что существует много вопросов, письма лежали в редакции, а в Science опубликовали очередную их статью с филогенетическим анализом.

ТрВ: Да, она какая-то совсем пустая была, эти результаты надо было публиковать в основной статье, а не отдельно. Это любой студент мог сделать.

ПП: Мне позвонил журналист из Washigton Post, и я сказал, что по поводу этой статьи серьезные эволюционные биологи будут смеяться. Потому что они соединили свои шесть пептидов, получили последовательность из 60 аминокислот и начали строить деревья. Но это же коллаген, там сама последовательность нетипичная, периодическая. Нет там материала для деревьев.

Зато Science получила колоссальную публичность и после первой статьи, и теперь. Вот так.

«Парк Юрского периода» в Манхэттене (НьюЙорк). Фото с сайта Wikipedia.org

Добавить комментарий

Ваш адрес email не будет опубликован.

Оценить: