Неправильная оценка статистической достоверности полученной информации может привести к игнорированию клинически важных сведений и использованию на практике бесполезных данных. Классическим приемом искажения реальных тенденций является значительное увеличение числа наблюдений, что позволяет доказать наличие даже столь небольших различий, которые не имеют реального клинического значения. В настоящее время существует немало программ для статистической обработки данных и руководств по медицинской статистике, где приведены необходимые формулы, даны подробные инструкции по обработке результатов медицинских исследований. Это значительно облегчило и сделало доступным проведение качественного статистического анализа практически любому врачу, имеющему навыки работы с персональным компьютером.
Для адекватного анализа полученных данных необходимо применять: для оценки выживаемости - методы, основанные на принципе построения таблиц доживания, кривые Каплана-Мейера, модель Кокса, формулы множественной пошаговой регрессии, показатели абсолютного и относительного риска; для выявления существенности различий между кривыми выживаемости - тест Вилкоксона-Гехана, обобщенный показатель кси-квадрат и критерий logrank.
При проведении клинических исследований наиболее часто используют две модели: модель постоянных эффектов, когда изучаемое вмешательство во всех исследованиях оказывает одинаковый эффект, а имеющиеся различия обусловлены только дисперсией внутри самих исследований; модель случайных эффектов, когда влияние вмешательства в разных исследованиях может быть разным. Она уже учитывает дисперсию не только внутри одного исследования, но и между разными исследованиями.
При количественной оценке результата существует два вида ошибки - систематическая и случайная: Случайная ошибка - отклонение результата отдельного наблюдения или измерения от его истинного значения, обусловленное исключительно случайностью. Систематическая ошибка - это систематическое (неслучайное) отклонение результатов от истинных значений.
Систематические ошибки могут быть обусловлены: эффектом плацебо; нарушением правил отбора пациентов; неудачно выбранным методом оценки результатов (субъективная оценка всегда дает завышенный результат по сравнению с данными прибора); неправильно проведенным статистическим анализом.
Методы снижения вероятности возникновения систематической ошибки в исследованиях с жесткими и суррогатными конечными точками
Одной из наиболее частых является систематическая ошибка при отборе больных. Она также называется смещением. Причины ее возникновения: Центростремительное смещение (centripetal bias). В его основе лежит концентрация больных в специализированных центрах при оказании квалифицированной помощи. Это приводит к тому, что в них собираются самые сложные и тяжелые больные, используются наиболее современные и эффективные методы диагностики и лечения, а также работают наиболее квалифицированные специалисты. Следовательно, результаты, полученные в таком центре, не в полной мере будут соответствовать реальной клинической практике;
Смещение вследствие популярности (popularity bias). В специализированных центрах в связи с их более мощными диагностическими возможностями и другими субъективными факторами часто наблюдаются непрофильные пациенты, которым проводится лечение, не соответствующее принятому в реальной клинической практике, так как у специалистов центра меньше опыта в лечении «атипичной» патологии, что также сказывается на результатах лечения; Смещение вследствие фильтрации (referral filter bias). По мере движения пациентов от поликлиники к специализированным центрам происходит дифференциация больных по ряду особенностей: тяжести течения заболевания, демографическим характеристикам, финансовым возможностям; Смещение вследствие доступности диагностики (diagnostic access bias). По сути является частным вариантом приведенного выше смещения вследствие фильтрации.
Частая причина возникновения систематической ошибки - эффект плацебо, который может завышать эффективность лекарства на 30-40%. Поэтому при применении лекарств с доказанной эффективностью число положительных эффектов должно существенно и достоверно превышать их частоту при приеме плацебо. Исключительную роль играет плацебо при оценке безопасности испытуемого препарата. Если новый препарат безопасен, число побочных, нежелательных и серьезных явлений должно быть одинаковым в группах лечения и плацебо.
Важнейшим понятием в клинических исследованиях является исход - клинически значимое явление, изменение лабораторного показателя или признака у лиц опытной и контрольной группы. Исходы являются основными критериями оценки эффективности диагностического, лечебного или профилактического вмешательства. ЧИЛ - частота исходов в группе лечения A/(A+B). ЧИК - частота исходов в контрольной группе C/(C+D). На основании исходов вмешательства строят таблицу сопряженности, с помощью которой рассчитываются другие важные показатели. 1. ОР (относительный риск) = (ЧИЛ/ЧИК) 2. Шанс = А/В или С/D. 3. ОШ (отношения шансов) = (А/В)/(С/D).
Одним из наиболее часто используемых понятий, описывающих полученные результаты, является термин «риск», отражающий частоту определенного исхода (под риском понимают вероятность какого либо события, которая может изменяться в диапазоне от 0 до 1. При вероятности, равной 0, событие никогда не произойдет, а при вероятности, равной 1, происходит всегда). В качестве примера можно рассмотреть виртуальное исследование, где сравнивается частота госпитализаций пациентов с хронической сердечной недостаточностью в контрольной группе больных, получающих плацебо, и в группе больных, получающих новый препарат Х, способный уменьшать число сердечных сокращений. Допустим, что в конце исследования при госпитализации в стационар у 50% больных в контрольной группе риск госпитализации равнялся 0,50, и только у 10% больных, получавших препарат Х, риск госпитализации равнялся 0,10. Исходя из того что относительный риск в группе лечения, сравниваемый с риском в контрольной группе, - простое отношение риска в двух группах и является частным от деления риска в группе лечения на риск в контрольной группе. Следовательно, в разбираемом примере он составляет 0,10 : 0,50 = 0,20. Эти сравнительные данные можно также представить в виде снижения относительного риска (отношение между снижением риска в группе лечения и риском в контрольной группе) или рассчитать как 1 - относительный риск.
Таким образом, показатели относительного риска и снижения относительного риска количественно отражают результаты вмешательства в относительных величинах, но не дают информации о размере влияния в абсолютном выражении. Абсолютный риск в меньшей степени отражает относительную эффективность вмешательства, но наглядно показывает, будет ли эффект от вмешательства клинически значимым. Абсолютный риск является основой для расчета другого более понятного для практического врача показателя - числа больных, которых необходимо лечить определенным методом в течение определенного времени, чтобы достичь определенного эффекта или предотвратить неблагоприятный исход у одного больного (ЧБНЛ).
В тех случаях, когда исследуемое вмешательство снижает вероятность развития неблагоприятного исхода, используются следующие показатели СОР (снижение относительного риска) - относительное уменьшение частоты неблагоприятных исходов в группе лечения по сравнению с контрольной группой, рассчитываемое как (ЧИЛ - ЧИК)/ЧИК; приводится вместе с 95% ДИ. САР (снижение абсолютного риска) - абсолютная арифметическая разница в частоте неблагоприятных исходов между группами лечения и контроля. Рассчитывается как (ЧИЛ - ЧИК). ЧБНЛ - число больных, которых необходимо лечить определенным методом в течение определенного времени, чтобы предотвратить неблагоприятный исход у одного больного. Рассчитывается как 1/САР и приводится вместе с 95% ДИ. Низкое значение ЧБНЛ, приближающееся к 1, означает, что благоприятный исход наблюдается почти у каждого больного, получающего лечение. Когда исследуемое вмешательство повышает вероятность развития благоприятного исхода, используют следующие показатели. ПОП (повышение относительной пользы) - относительное увеличение частоты благоприятных исходов в группе лечения по сравнению с контрольной группой, рассчитываемое как (ЧИЛ - ЧИК)/ЧИК; приводится с 95% ДИ. ПАП (повышение абсолютной пользы) - абсолютная арифметическая разница в частоте благоприятных исходов между группами лечения и контроля. Рассчитывается как (ЧИЛ - ЧИК).
Если исследуемое вмешательство повышает вероятность развития неблагоприятного исхода, используются следующие показатели. ПОР (повышение относительного риска) - относительное увеличение частоты неблагоприятных исходов в группе лечения по сравнению с контрольной группой. Рассчитывается как (ЧИЛ - ЧИК)/ЧИК; приводится вместе с 95% ДИ. ПОР также используется для оценки влияния факторов риска на развитие заболевания. ПАР (повышение абсолютного риска) - абсолютная арифметическая разница в частоте неблагоприятных исходов между группами вмешательства и контроля. Рассчитывается как (ЧИЛ - ЧИК). ПАР также используется для оценки влияния факторов риска на развитие заболевания. ИПВ (индекс потенциального вреда) - число больных, которые должны получить экспериментальное лечение, чтобы у одного дополнительного больного развился неблагоприятный исход, - по сравнению с больными из контрольной группы. Рассчитывается как 1/ПАР и приводится вместе с 95% ДИ.