Вербальные шкалы 1
Надежность доверительных интервалов (ДИ) Уровень значимости α Уровень доверия 100(1 – α)% Степень надёжности ДИ 0,0595%Низкая 0,0199%Средняя 0,00199,9%Высокая 2
Возможные словесные интерпретации для градаций распознавательной способности диагностического теста Se и Sp Se = P(T+|D+) Чувствительность «позитивов» к наличию болезни 0,0 – 0,5Практически бесполезная 0,5 – 0,7Низкая 0,7 – 0,9Средняя 0,9 – 1,0Высокая Sp = P(T-|D-) Специфичность «негативов» в отношении отсутствия болезни 3
Возможные словесные интерпретации для градаций показателей предсказательной способности диагностического теста PPV и NPV PPV = P(D+|T+) Способность «позитивов» предсказывать наличие болезни 0,0 – 0,5Практически бесполезная 0,5 – 0,7Низкая 0,7 – 0,9Средняя 0,9 – 1,0Высокая NPV = P(D-|T-) Способность «негативов» предсказывать отсутствие болезни 4
Принятые словесные интерпретации для градаций отношений правдоподобий LR[+] и LR[-] LR[+] Повышение пост тестовых шансов за/против наличия болезни у субъекта с позитивом по сравнению с претестовыми шансами за/против наличия у него болезни 1 – 3Практически ничтожное 3 – 10Малое 10 – 33Среднее 33 – 100Высокое 100 – 1000Очень высокое > 1000Практически идеальное LR[-] Повышение пост тестовых шансов за/против отсутствия болезни у субъекта с негативом по сравнению с претестовыми шансами за/против отсутствия у него болезни 5
С ловесные интерпретации для градаций AUC Интервал AUC Способность диагностического теста распознавать наличие или отсутствие болезни 1,0 – 0,9Отличная 0,8 – 0,9Хорошая 0,7 – 0,8Удовлетворительная 0,6 – 0,7Посредственная 0,5 – 0,6Неудовлетворительная 6
7 Традиционная интерпретация значений P val и шкала Michelin Значение P val Статистическая значимость Шкала Мишлена > 0,05Незначимо 0,05 – 0,01Умеренно значимо* 0,01 – 0,001Значимо** < 0,001Высоко значимо*** 7
8 Калибровки значения P val Значение P val Верхняя граница предсказательного 80%-го интервала для P val Нижняя граница для вероятности нулевой гипотезы P(H 0 ) Верхняя граница для вероятности воспроизведения Р repr 0,050,44> 30%< 50% 0,010,22> 10%< 73% 0,0010,07> 2%< 90% Для наглядности значения в таблице округлены до первой значащей цифры. Более точно значения для нижней границы P(H 0 ) (сверху вниз) равны 29%, 11% и 1,8%. Cumming G. Replication and p intervals: p values predict the future only vaguely, but confidence intervals do much better // Persp. Psychol. Sci., Vol. 3. No.4. – P Sellke T., Bayarri M.J., Berger J.O. Calibration of p values for testing precise null hypotheses // The American Statistician, Vol. 55, No. 1. (2001), pp Goodman S.N. A comment on replication, p-values and evidence // Statistics in Medicine, – Vol. 11. – P
9 Более реалистичная интерпретация значений P val Значение P val Статистическая значимость > 0,05Незначимо 0,05 – 0,001Неопределенно 0,001 – 0,0001Значимо < 0,0001Высоко значимо 9
Интерпретация убедительности Бейзовых факторов, BF 10 и BF 01 BF 01 Свидетельство в пользу гипотезы Н 0 против гипотезы Н 1 >100Убедительное 30 – 100Очень сильное 10 – 30Сильное 3 – 10Умеренное (слабое) 1 – 3Пренебрежимо малое BF 10 Свидетельство в пользу гипотезы Н 1 против гипотезы Н 0 10
11 Интерпретация стандартизированного размера эффекта по Коуэну d C Размер эффекта, d C Градация эффекта 0 – 0,2Ничтожный 0,2 – 0,5Малый 0,5 – 1,0Средний 1,0 – 2,0Большой 2,0 – 4,0Очень большой 4,0 - Исключительно большой 11 По Хопкинсу (Hopkins W.G.) с упрощениями
Словесная интерпретация для градаций модуля разности долей |RD| и для числа субъектов, подлежащих воздействию NNT 12 |RD|NNT Интерпретация клинического эффекта < 0,01> 100Ничтожный 0,01 – 0,05100 – 20Малый 0,05 – 0,220 – 5Умеренный 0,2 – 0,52 – 5Высокий > 0,5< 2< 2Очень высокий
Словесная интерпретация (вербальная шкала) градаций для отношения долей RR RRИнтерпретация клинического эффекта 1,0 – 3,0Практически ничтожный 3,0 – 10Слабый 10 – 33Умеренный 33 – 100Сильный > 100Очень сильный 13
Словесная интерпретация (вербальная шкала) градаций для отношения шансов OR OR Интерпретация силы статистической связи 1 – 1,5Практически ничтожная 1,5 – 3,5Очень слабая 3,5 – 9,0Слабая 9,0 – 32Умеренная 32 – 360Сильная > 360Практически идеальная 14 По Хопкинсу (Hopkins W.G.)