Вопреки широко распространенному мнению о традиционности медицины, на самом деле она является быстро развивающейся наукой. Это продиктовано не только разработкой новых методов лечения, но и появлением новых факторов риска различных заболеваний.
Соотношение эффективности и безопасности служит ключевым аспектом, на который подобает ориентироваться при выборе тактики лечения. К сожалению и к радости, у нас в распоряжении имеется только один-единственный метод оценки действенности лекарства — это клинические исследования. Этому сложному в работе, а в неумелых руках — разрушительному инструменту медицинской науки и будет посвящена настоящая статья.
Специально для ТрВ-Наука — Ярослав Ашихмин, кардиолог, канд. мед. наук, автор более 70 научных публикации, член Европейской ассоциации кардиологов (ESC) и Американской ассоциации сердца (AHA).
Как узнать, помогает ли лекарство при болезни?
Казалось бы, это просто: стоит оценить состояние больного человека до и после его приема — и ответ уже у нас в кармане! Именно так мы делаем собственные выводы о том, «подходит» ли нам лекарство, а врач накапливает опыт лечебной работы. Сделанные на основании такого рода наблюдений заключения могут быть полезны и для медицинской науки, но не очень часто, а именно при лечении редких болезней и «сложных» пациентов.
Попробуйте уловить эту тонкую грань: доктор индивидуально подбирает лечение больным, каждый из которых уникален; на основании своего опыта он может назначать в том числе и недостаточно хорошо изученные лекарства или их сочетания. Но он не имеет морального права передавать свой опыт другим врачам до того момента, как он будет подвергнут научной проверке.
Что в опыте тебе моем?
Причины ошибок в оценке действенности лекарств самые разные.
Во-первых, невероятной силой обладает… плацебо (а значит, автоматически все гомеопатические средства и БАДы). Плацебо всегда широко тайно применялось на практике, в том числе и признанными специалистами в аллопатической медицине. Так, великий терапевт М.Я. Мудров в ряде случаев назначал больным особые «простой», «золотой» и «серебряный» порошки. По данным Г. Бичера, опубликованным в статье «The powerful placebo«, плацебо служит действенным методом лечения в 35% случаев.
Во-вторых, накопивший большой собственный опыт применения того или иного метода врач, как правило, имеет дело с ограниченным кругом больных. «Необкатанные» авторские методики, словно прототипы автомобилей, хороши в руках их создателей, но редко подходят для рутинной клинической практики.
Наконец, врач может использовать метод, к которому он «прикипел», не принимая на вооружение новые медицинские технологии. И далеко не всегда это обусловлено косностью и нежеланием учиться, а бывает связано с объективными реалиями функционирования нашей системы здравоохранения.
Секреты научной кондитерской
Как же получить доказательства того, что препарат в действительности работает?
Итак, первоначально необходимо выбрать популяцию пациентов, которая должна максимально соответствовать тем реальным больным, которые будут впоследствии получать данное лечение. Например, при исследовании терапии хронических болезней очень важно учитывать возраст включаемых больных, а при лечении ургентных пациентов — сроки после начала заболевания и степень тяжести.
Далее необходимо выбрать так называемые «конечные точки», т.е. четкие критерии, по которым впоследствии будут судить об эффективности лечения. Конечные точки могут быть «мягкими», например улучшение картины болезни по данным УЗИ, или «жесткими», такими, как выздоровление от заболевания или уровень смертности. В последнее время в моду всё больше входят «комбинированные конечные точки», объединяющие неравнозначные исходы, например число летальных исходов плюс число госпитализаций в связи с обострением заболевания.
Надо понимать, что выбранная конечная точка — как сургучная печать. Так, в случае использования освещенной выше комбинированной конечной точки, если перевес в эффективности в конечном итоге будет достигнут только из-за снижения риска госпитализации, а число смертей не изменится, то препарат формально будет признан эффективным и, весьма вероятно, войдет в официальные рекомендации. Таких примеров смешения «жестких» и «мягких» точек сегодня немало (см., например, исследование SENIORS).
Испытываемое лекарство нужно обязательно с чем-то сравнивать. Если лечение заболевания не разработано, то в роли препарата сравнения выступает плацебо, а если оно имеется — существующий общепризнанный стандарт лечения. «Традиционные» средства также различаются между собой по эффективности, что является почвой для спекуляций: некоторые исследователи стремятся сравнить новый препарат с заведомо более слабым конкурентом, формально входящим в рекомендации, но в реальности практически не использующимся (например, в исследованиях новых бета-блокаторов в качестве контрольного препарата часто используется атенолол).
Препарат сравнения в идеале должен быть неотличим от исследуемого лекарства и для больного, и для врача-исследователя — это двойной слепой метод. Его использование является залогом минимизации ошибок, обусловленных субъективностью врачей и пациентов.
Попадание больного в ту или иную группу- рандомизация — определяется генератором случайных чисел. При совмещении этих двух методов исследование становится двойным слепым рандомизированным плацебо-контролируемым (РКИ), т.е. работой «высшей пробы».
Такие исследования не нарушают принципов этики в том случае, если больному подробно разъяснены все аспекты работы, в том числе шансы попадания в ту или иную группу, и получено информированное согласие.
За соблюдением принципов биоэтики следит Этический комитет, без санкции которого исследование не может быть запущено.
Табель о рангах
Степень доверия к результатам клинических исследований напрямую связана с уровнем их доказательности. Чтобы сориентироваться в океане исследований, необходимо понимать их старшинство.
На нижнем ярусе находятся исследования типа «случай—контроль», к которым относится большинство диссертационных работ и небольших отечественных исследований. При их проведении группа пациентов, получающих то или иное лечение, сравнивается с группой, его не получавшей. Рандомизация, как правило, не проводится, а слепой метод не используется. Зачастую исследуемые группы пациентов плохо сопоставимы. Такие исследования приемлемы в том случае, когда речь идет о лечении очень редких болезней,так как они позволяют набрать достаточное для анализа количество наблюдений.
Далее в доказательной лестнице располагаются так называемые анализы регистров пациентов. В настоящее время они набирают популярность в связи с накоплением в них большого массива наблюдений за пациентами. Сегодня мы часто слышим сообщения о «сенсационных» данных о наличии фантастических взаимосвязей или неожиданно выраженном влиянии того или иного препарата на смертность (причем в обе стороны), основанные именно на анализе таких регистров.
Регистры представляют базы данных, в которые вносятся всевозможные характеристики наблюдаемых в условиях реальной клинической практики пациентов, результаты их обследований и назначенное лечение. Врачи, которые вносят информацию о своих пациентах в такой регистр, обычно понятия не имеют, с какой целью она будет использована через несколько лет.
Средний ярус в иерархии доказательной медицины занимают проспективные когортные исследования. Их дизайн регламентируется до начала включения больных, которые прослеживаются на протяжении длительного времени. Минусами этого типа исследований служат предвзятое распределение в группы и отсутствие заслепления.
Законодателями мод в мире доказательной медицины по праву являются описанные выше РКИ, в которых возможность ошибки сведена к минимуму. Стандартная формула их результатов выглядит так: «В РКИ XXX, включавшем столько—то тысяч больных, было показано, что по сравнению с плацебо препарат А статистически значимо снижает смертность от заболевания Б на Х%». К сожалению, многие врачи этим выводом и ограничиваются, не уделяя внимания деталям, речь о которых пойдет ниже.
На вершине иерархии стоят так называемые мета—анализы, «объединяющие» результаты нескольких РКИ с привлечением аппарата биомедицинской статистики. Наиболее авторитетной организацией, занимающейся проведением мета-анализов, является «The Cochrane Collaboration«. «Кохрейновские» мета-анализы проводятся по очень жестким правилам, регламентирующим принципы отбора и обработки информации.
Коварная статистика
Авторы дизайна исследования стараются заложить в его фундамент конструкции, которые помогут реализовать даже самые мизерные, но клинически значимые преимущества препарата перед конкурентами или плацебо. И главная битва за превосходство нового метода над препаратом сравнения разгорается на этапе статистической обработки результатов. Ученые-«миротворцы» ранее связывали свои надежды с применением так называемого «тройного слепого метода», при котором распределение пациентов по группам оказывается неизвестно не только врачам и самим больным, но и статистикам, обрабатывающим данные. Но по понятным причинам этот метод не прижился.
Для того чтобы утверждать, что препарат работает (т.е. влияет на достижение конечных точек), необходимо провести статистическую обработку с применением ряда математических критериев. Причем в большинстве случаев могут быть использованы различные методы обработки данных, и не всегда то, какой метод будет применяться, решается до начала исследования.
Интересно, что широко (и в большинстве случаев — неправомерно!) применяемый критерий Стюдента был придуман Вильямом Гроссетом, заботившимся о том, как не переложить дрожжей в знаменитое пиво «Гиннесс». Другой критерий был предложен Фишером, задумавшимся над тем, сколько чашек чая с молоком нужно протестировать, чтобы узнать, не обманывает ли его леди, уверяющая, что она умеет отличать, что первое налили в чашку — молоко или чай.
Поймай р, если сможешь
Сегодня лекарство признается действенным, если оно статистически значимо влияет на достижение конечных точек. При этом даже «очень сильное» воздействие может быть незначимым статистически и наоборот. Степень значимости определяется уровнем р, за достижение значения которого «ниже 0,05» ведется настоящая борьба.
Шансы «победить плацебо» можно повысить, если запланировать несколько промежуточных анализов, успев остановить исследование тотчас, как кривые эффективности (Каплана-Мейера) начнут расходиться. Формальным обоснованием могут служить этические соображения, в первую очередь, необходимость назначения лечения контрольной группе. При этом в некоторых случаях, пронаблюдав группы чуть дольше, можно обнаружить, что эффективность лечения и плацебо вновь уравнивается. Поэтому результаты большинства «досрочно завершенных» исследований следует трактовать с осторожностью.
Бюро корректировки
Истинное мастерство статистика проявляется при необходимости скорректировать результаты по другим факторам риска, что обозначается в английском языке емким словом adjustment. В действительности, больные в экспериментальной группе могут быстрее выздоравливать не из-за действия лекарства per se, а из-за других факторов (например, более частого назначения антибиотиков, молодого возраста или более легкого течения заболевания). Безусловно, такой анализ крайне важен ввиду того, что без его проведения часто никак нельзя отделить действие лекарства от влияния иных факторов. Но возможность легко изменять размер эффекта в ту или иную сторону, проводя adjustment по кластерам факторов риска, иногда создает соблазн представить картину лучше, чем она есть. Хорошим тоном служит упоминание в протоколе еще до начала исследования тех факторов, по которым в итоге будет проводиться корректировка.
Чудо анализа подгрупп
Анализ подгрупп крайне важен в том случае, если популяция пациентов недостаточно однородна. В крупных исследованиях заранее определяется то, какие подгруппы будут анализироваться раздельно по-завершении работы (что называется pre-specified subgroup analysis). Так, например, традиционно проводятся анализы различных возрастных подгрупп. При «провале» исследования предварительно запланированные анализы подгрупп могут выступать «спасательным кругом». Напротив, если в исследовании в целом будут показаны хорошие результаты, а в одной из подгрупп лечение не будет эффективно,такой анализ обычно старательно прячется в самые укромные уголки главы «Результаты» и редко впоследствии принимается во внимание.
Как бы этого ни хотелось спонсорам, но данные a posteriori проведенных анализов подгрупп никогда не будут приняты в качестве доказательств западными регуляторными органами и в серьезных научных кругах.
Исследования—близнецы
Другим интересным приемом, также основанным на делении пациентов на группы, является создание исследований-близнецов, дизайны которых имеют минимальные различия (например, испытание одного препарата для лечения одного заболевания на разных стадиях). При получении положительных результатов в обоих исследованиях их данные затем объединяются и выходят одной публикацией в рейтинговом журнале. А при отрицательном результате, полученном в одном из исследований, акценты часто сдвигаются на выигрышную работу, а результаты брата-неудачника публикуются в небольшом журнале. Или вовсе не публикуются.
Вспомнить всё
Масштабы скрытых от нас данных «провалившихся» исследований поистине огромны. Если проанализировать инициированные КИ, зарегистрированные на сайте www.clinicaltrials.gov, и сопоставить их с количеством завершенных работ, то окажется, что подводная часть айсберга «доказательной медицины» составляет до 80% его объема. Эта «темная материя» в основном состоит из начатых, но затем по непонятным причинам остановленных КИ. Отсутствие у медицинского сообщества данных о побочных эффектах и низкой эффективности «инновационных» методов лечения заставляет исследователей по всему миру раз за разом наступать на одни и те же грабли, повторяя заведомо неудачные эксперименты.
Как поступать лечащему врачу?
Таким образом, доказательная медицина предоставляет базис, на который должны опираться суждения врача об оптимальной тактике лечения. При выборе того или иного метода лечения врач полагается в первую очередь на собственный опыт, тем не менее он просто обязан знать о результатах всех основных исследований в сфере тех патологий, которые он ежедневно лечит.
Среди очень опытных врачей сегодня все большую популярность набирает так называемое индивидуализированное, «точно подогнанное» лечение (talented medical care, TMC ), которое часто идет вразрез с рекомендациями. Не касаясь этических и организационных вопросов, следует отметить, что для использования TMC врач должен обладать исключительно высокой квалификацией, посещать соответствующие секции на мировых медицинских конгрессах и досконально знать все РКИ в зоне своей ответственности.
Часто малообразованные, но самонадеянные врачи защищают «надежный», но не проверенный в РКИ метод лечения, проводя аналогию с парашютами, которые «никогда не исследовались в РКИ, но в их эффективности никто не сомневается». Хотелось бы посоветовать им, если здоровье позволяет, получить удовольствие при случае совершить увлекательный прыжок не с современным, а с хорошо зарекомендовавшим себя «на практике» и применяемым с начала XX века немецким складным парашютом.