Рассуждения на тему статистики Альфредо Гарсиа – Арьета Доктор наук Учебный практикум: Подготовка оценщиков по БЭ, Киев, октябрь 2009 года Всемирная организация здравоохранения
Training workshop: Training of BE assessors, Kiev, October |2 | План работы Основополагающие концепции в статистике о эквивалентности Как выполнить статистический анализ перекрестного исследования по биоэквивалентности 2x2 Как рассчитать размер выборки перекрестного исследования по биоэквивалентности 2x2 Как рассчитать коэффициент изменчивости (КИ) на основе 90%-го доверительного интервала в исследовании по биоэквивалентности
Training workshop: Training of BE assessors, Kiev, October |3 | Основополагающие концепции в статистике
Training workshop: Training of BE assessors, Kiev, October |4 | Типы исследований Исследования превосходства –A лучше B (A = активное вещество и B = плацебо или золотой стандарт) –Обычное одностороннее исследование для проверки сделанного предположения (гипотезы) Исследования эквивалентности –A более-менее походит на B (A = активное вещество и B = стандарт) –Двустороннее предположение с интервалом Исследования по доказательству отсутствия превосходства –A не хуже B (A = активное вещество и B = стандарт с побочными явлениями) –Одностороннее предположение с интервалом
Training workshop: Training of BE assessors, Kiev, October |5 | Проверка сделанного предположения\гипотезы Обычная проверка предположения\гипотезы Г 0 : = 1 Г 1 : 1 (в данном случае – одностороннее) Если P
Training workshop: Training of BE assessors, Kiev, October |6 | Нулевая и альтернативная гипотезы Фишер, Р.A. Проект экспериментов, Оливер и Бойд, Лондон, 1935 год Нулевую гипотезу невозможно доказать или установить, но можно опровергнуть в ходе опытов. Можно сказать, что каждый эксперимент существует для предоставления фактам возможности опровергнуть гипотезу Частая ошибка: Отсутствие статистической значимости трактуют неверно как отсутствие клинически соответствующих отличий.
Training workshop: Training of BE assessors, Kiev, October |7 | Эквивалентность Нам интересно проверить (а не отказываться от) нулевую гипотезу в обычном анализе предположений Нам предстоит еще раз дать определение альтернативной гипотезе как ряду величин, имеющих эквивалентное воздействие Все отличия в данном диапазоне считаются клинически неподходящими Задача: очень тяжело определить максимальную разницу без клинически подходящего значения максимальной концентрации и площади под кривой у каждого препарата Решение: 20% основывается на исследованиях самих врачей
Training workshop: Training of BE assessors, Kiev, October |8 | Гипотеза с интервалом или два односторонних анализа Новое определение нулевой гипотезы: Как? Решение: Это все равно, что поменять ноль на альтернативную гипотезу и наоборот. Анализ на альтернативную гипотезу: Шюирманн, 1981 год –Г 01 : 1 Г a1 : 1 < –Г 02 : 2 Г a2 : < 2. Что эквивалентно: – Г 0 : 1 или 2 Г a : 1 < < 2 Носит название гипотезы с интервалом потому, что предположение эквивалентности находится в альтернативной гипотезе, и оно выражается в виде интервала
Training workshop: Training of BE assessors, Kiev, October |9 | Гипотеза с интервалом или два односторонних анализа Новая альтернативная гипотеза решается путем статистики, которая следует распределению о том, что ее можно приблизить к t-распределению Для выводов по биоэквивалентности необходимо получить значение P
Training workshop: Training of BE assessors, Kiev, October | Точечная оценка отличий Если Анализируемый=Контрольный, то d=А-К=0 Если Анализируемый > Контрольный, то d=А-К>0 Если Анализируемый < Контрольный, то d=А-К 0 Положительное воздействие
Training workshop: Training of BE assessors, Kiev, October | Расчеты с доверительными интервалами в испытаниях превосходства d < 0 Отрицательное воздействие d = 0 Без отличий d > 0 Положительное воздействие Доверительный интервал 90% - 95% Статистически не существенно! Потому что ДИ содержит значение d=0
Training workshop: Training of BE assessors, Kiev, October | Расчеты с доверительными интервалами в испытаниях превосходства d < 0 Отрицательное воздействие d = 0 Без отличий d > 0 Положительное воздействие Доверительный интервал 90% - 95% Статистически существенно! Потому что ДИ не содержит значение d=0
Training workshop: Training of BE assessors, Kiev, October | Расчеты с доверительными интервалами в испытаниях превосходства d < 0 Отрицательное воздействие d = 0 Без отличий d > 0 Положительное воздействие Доверительный интервал 90% - 95% Статистически существенно с P=0.05 Потому что границы ДИ касаются значения d=0
Training workshop: Training of BE assessors, Kiev, October | Исследование эквивалентности d < 0 Отрицательное воздействие d = 0 Без отличий d > 0 Положительное воздействие - + Область клинической эквивалентности
Training workshop: Training of BE assessors, Kiev, October | Эквивалентность и отличия d < 0 Отрицательное воздействие d = 0 Без отличий d > 0 Положительное воздействие - + Область клинической эквивалентности Эквивалентны?Отличаются? Нет ? Да ? ? ? ? Нет
Training workshop: Training of BE assessors, Kiev, October | Исследования по доказательству отсутствия превосходства d < 0 Отрицательное воздействие d = 0 Без отличий d > 0 Положительное воздействие - Пределы наличия превосходства Таки превосходит? Да ? Нет ?
Training workshop: Training of BE assessors, Kiev, October | Исследование превосходства (?) d < 0 Отрицательное воздействие d = 0 Без отличий d > 0 Положительное воздействие + Пределы превосходства Превосходит? Нет, не клинически, но да статистически ?, но да статистически Да, статистически и клинически Нет Нет, не клинически и? статистически ? Да, но только точечная оценка
Training workshop: Training of BE assessors, Kiev, October | Как выполнить статистический анализ по перекрестному исследованию 2x2 на биоэквивалентность
Training workshop: Training of BE assessors, Kiev, October | Статистический анализ исследований по БЭ Заказчикам приходится использовать валидированные программные продукты –Например SAS, SPSS, Winnonlin, и т.д. Раньше можно было отыскать статистический анализ, выполненный на неправильной программе. –В основе расчетов вместо минимальных среднеквадратичных значений – среднее арифметическое, из-за чего – необъективные результаты в несбалансированных исследованиях Несбалансированность: разное число испытуемых в каждой последовательности –Расчеты по воспроизводимым проектам сложнее и там больше шансов ошибиться
Training workshop: Training of BE assessors, Kiev, October | Статистический анализ не так сложен Период 2Период 1Исследование по БЭ 2x2 Количество (N) =12 Y 12 Y 11 Последовательность 1 (BA) BA это КА (кон. и аналит. Y 22 Y 21 Последовательность 2 (AB) AB это АК (аналит. и контр.)
Training workshop: Training of BE assessors, Kiev, October | Нам не нужно рассчитывать таблицу по анализу вариаций
Training workshop: Training of BE assessors, Kiev, October | С помощью сложных формул Суммарное Изнутри Между
Training workshop: Training of BE assessors, Kiev, October | И еще более сложных формул Между ПереносСреди Перенос Среди
Training workshop: Training of BE assessors, Kiev, October | И на самом деле еще более сложных формул Изнутри Препарат Период Внутри Период Внутри
Training workshop: Training of BE assessors, Kiev, October | С ниже заданными значениями все просто Период 2Период 1Испытания по БЭ 2x2 Количество N=12 Y 12 70, 90, 95, 70, 60, 70 Y 11 75, 95, 90, 80, 70, 85 Последовательность 1 (BA) Y 22 40, 50, 70, 80, 70, 95 Y 21 75, 85, 80, 90, 50, 65 Последовательность 2 (AB)
Training workshop: Training of BE assessors, Kiev, October | Вначале преобразовываем данные в логарифм Период 2Период 1Испытания по БЭ 2x2 Количество N=12 Y , , , , , Y , , , , , Последовательность 1 (BA) Y , 3,9120, 4,2485, , , Y , , , 4,4998, 3,9120, Последовательность 2 (AB)
Training workshop: Training of BE assessors, Kiev, October | Во-вторых, рассчитываем среднее арифметическое каждого периода и последовательности Период 2Период 1Испытания по 2x2 Количество N=12 Y 12 = 4.316Y 11 = 4.407Последовательность 1 (BA) Y 22 = 4,172Y 21 = 4.288Последовательность 2 (AB)
Training workshop: Training of BE assessors, Kiev, October | Обратите внимание на разницу между средним арифметическим и минимальным среднеквадратичным значением Среднее арифметическое (СА) Анализируемого (или Контрольного) есть средним значением всех наблюдений с А (или К) несмотря на их группу последовательности –Всем наблюдениям присваивается одно и то же удельное значение Минимальное среднеквадратичное значение (МСК) анализируемого (или К) – это среднее от двух последовательностей на среднее за период –При сбалансированных исследованиях СА = МСК –При несбалансированных исследованиях наблюдения в последовательностях с меньшим числом испытуемых получают больше значения –При серьезном дисбалансе между последовательностями из-за выбывания и отчисления испытуемых крен СА будет заметен
Training workshop: Training of BE assessors, Kiev, October | В-третьих, рассчитайте МСК Анализируемого и Контрольного препаратов Период 2Период 1Испытания по 2x2 Количество N=12 Y 12 = 4.316Y 11 = 4.407Последовательность 1 (BA) Y 22 = 4,172Y 21 = 4.288Последовательность 2 (AB) B = A =
Training workshop: Training of BE assessors, Kiev, October | В-четвертых, рассчитайте точечную оценку F = МСК Анализируемого (A) – МСК Контрольного (B) F = – = Шаг пятый! Преобразовываем обратно в изначальную шкалу Точечная оценка= e F = e = Для расчета точечной оценки всего пять простых шагов!!!
Training workshop: Training of BE assessors, Kiev, October | Теперь надо рассчитать вариабельность! Шаг 1: Считаем разницу между периодами по каждому испытуемому и делим ее на 2: (П2-П1)/2 Шаг 2: Считаем среднее значение от этой разницы внутри каждой последовательности для получения 2 средних: d 1 и d 2 Шаг 3: Считаем разницу между отличиями в каждом из испытуемых иих соответствующими средними значениями последовательности. Потом производим из них квадратный корень. Шаг 4: Суммируем эти квадраты разности Шаг 5: Делим их на (n 1 +n 2 -2), где n 1 и n 2 это количество испытуемых в каждой последовательности. В этом примере = 10 –Значение, умноженное на 2 и есть СКЭ (среднеквадратичная эквивалентность) –Коэффициент вариаций (%) = 100 x e СКЭ -1
Training workshop: Training of BE assessors, Kiev, October | Это легко делается в Экселе! Период КАШаг 1 Шаг 3 Шаг 4 Сумма СКЭ КВ Шаг 5 К А
Training workshop: Training of BE assessors, Kiev, October | Шаг 1: Считаем разность между периодами по каждому испытуемому и делим ее на 2: (P2-P1)/2 Период КА Шаг 2 Шаг 1
Training workshop: Training of BE assessors, Kiev, October | Шаг 2: Считаем среднее значение этих разностей внутри каждой последовательности для получения 2-х средних величин: d1 и d2 Период К А Шаг 1 Шаг 2
Training workshop: Training of BE assessors, Kiev, October | Шаг 3: Квадраты разности Период КА Шаг 1 Шаг 3 Шаг 2
Training workshop: Training of BE assessors, Kiev, October | Шаг 4: Сложите эти квадраты разностей в сумму Шаг 3 Сумма Шаг 4 Шаг 5 СКЭ КВ
Training workshop: Training of BE assessors, Kiev, October | Шаг 5: Делим сумму на n 1 +n 2 -2 где n – это количество Шаг 3 Шаг 4 СКЭ КВ
Training workshop: Training of BE assessors, Kiev, October | Рассчитываем доверительный интервал с точечной оценкой и вариабельностью Шаг 11: В логарифмической шкале 90% ДИ: F ± t (0.1, n1+n2-2) -((Sigma 2 (d) x (1/n 1 +1/n 2 )) F уже рассчитали ранее Значение t получается из t-таблиц Студьента с 0,1 альфа и n 1 +n 2 -2 степенями свободы –Либо в MS Excel с формулой =РАСПРЕД.T.INV(0.1; n 1 +n 2 -2) Sigma 2 (d) уже рассчитали.
Training workshop: Training of BE assessors, Kiev, October | Последний расчет: 90%-й Доверительный интервал Логарифмическая шкала 90% ДИ: F±t (0.1, n1+n2-2) - ((Sigma 2 (d)·(1/n 1 +1/n 2 )) F = t (0.1, n1+n2-2) = Sigma 2 (d) = % ДИ: от LL = до UL= 0,17107 Шаг 12: Обратно преобразовываем пределы с e LL и e UL e LL = e = и e UL = e =
Training workshop: Training of BE assessors, Kiev, October | Как рассчитывать объем выборки перекрестного исследования по биоэквивалентности 2x2
Training workshop: Training of BE assessors, Kiev, October | Причины, обусловливающие правильный расчет объема выборки Слишком много испытуемых –Является неэтичным привлекать больше испытуемых, чем требуется –Некоторые испытуемые рискуют, и в них нет необходимости –Это ненужная трата некоторых ресурсов ($) Слишком мало испытуемых –Исследование, которое не может достичь поставленных целей, - неэтично –Все испытуемые ничем не рискуют –Все ресурсы ($) тратятся впустую, когда исследование не доведено до конца
Training workshop: Training of BE assessors, Kiev, October | Частые ошибки Для расчета необходимого объема выборки с целью обнаружения 20%-й разности, основываясь на предположении о, например, равности варианта испытаний –Покок, Клинические исследования, 1983 год Использование расчетов на основе данных без преобразования в логарифмы –Проект и анализ исследований по биоэквивалентности и биодоступности, Чау и Лю, 1992 (1-е издание) и 2000 (2-е издание) Слишком много ненужных испытуемых. Как правило можно обойтись и 10%. Зависит от переносимости –10% предлагают Паттерсон и ученики, Eur J Clin Pharmacol 57: (2001)
Training workshop: Training of BE assessors, Kiev, October | Методы расчета объема выборки С помощью кривых критерия мощности надо получить точные значения На основе этой формулы получаются приближенные значения –Наилучшее приближение: итеративный процесс (t-анализ) –Приемлемое приближение: в основе – Нормальное распределение Расчеты отличаются, когда мы предполагаем равность препаратов и когда мы предполагаем, что препараты немного отличаются Любое незначительное отклонение маскируется привлечением дополнительных испытуемых для компенсации выбывших и отчисленных (10%)
Training workshop: Training of BE assessors, Kiev, October | Расчет, предполагающий равность варианта испытаний Z(1-( /2)) = РАСПРЕД.НОРМ.ESTAND.INV(0.05) для 90% 1- Z(1-( /2)) = РАСПРЕД.НОРМ.ESTAND.INV(0.1) для 80% 1- Z(1- ) = РАСПРЕД.НОРМ.ESTAND.INV(0.05) для 5% КВ выражается как 0.3 на 30%
Training workshop: Training of BE assessors, Kiev, October | Пример расчета, предполагающего равность варианта испытаний Если мы желаем мощность 80%, Z(1-( /2)) = Риск потребителей всегда 5%, Z(1- ) = Тогда уравнение будет: (Количество) N = x S 2 При заданном КВ 30%, S 2 = 0, Тогда N (количество) = 29,64 Надо округлить до следующего парного числа: 30 Плюс например 4 дополнительных испытуемых в случае выбывания
Training workshop: Training of BE assessors, Kiev, October | Пример расчета, предполагающего равность варианта испытаний Если мы желаем мощность 90%, Z(1-( /2)) = Риск потребителей всегда 5%, Z(1- ) = Тогда уравнение будет: (Количество) N = x S 2 При заданном КВ 25%, S 2 = 0, Тогда N (количество) = 26,35 Надо округлить до следующего парного числа: 28 Плюс например еще 4 дополнительных испытуемых в случае выбывания
Training workshop: Training of BE assessors, Kiev, October | Пример расчета, предполагающего неравность варианта испытаний Z(1- ) = РАСПРЕД.НОРМ.ESTAND.INV(0.1) для 90% 1-b Z(1- ) = РАСПРЕД.НОРМ.ESTAND.INV(0.2) для 80% 1-b Z(1- ) = РАСПРЕД.НОРМ.ESTAND.INV(0.05) для 5% a
Training workshop: Training of BE assessors, Kiev, October | Пример расчета, предполагающий 5%-ю разность варианта испытаний Если мы желаем мощность 90%, Z(1- ) = Риск потребителей всегда 5%, Z(1- ) = Если мы предполагаем, что T / R =1.05 Тогда уравнение будет: (Количество) N = x S 2 При заданном КВ 40 %, S 2 = 0, Тогда N (количество) = Надо округлить до следующего парного числа: 84 Плюс например еще 8 дополнительных испытуемых в случае выбывания
Training workshop: Training of BE assessors, Kiev, October | Пример расчета, предполагающий 5%-ю разность варианта испытаний Если мы желаем мощность 80%, Z(1- ) = Риск потребителей всегда 5%, Z(1- ) = Если мы предполагаем, что T / R =1.05 Тогда уравнение будет: (Количество) N = x S 2 При заданном КВ 20 %, S 2 = 0, Тогда N (количество) = Надо округлить до следующего парного числа: 16 Плюс например еще 2 дополнительных испытуемых в случае выбывания
Training workshop: Training of BE assessors, Kiev, October | Пример расчета, предполагающий 10%-ю разность варианта испытаний Если мы желаем мощность 80%, Z(1- ) = Риск потребителей всегда 5%, Z(1- ) = Если мы предполагаем, что T / R =1.11 Тогда уравнение будет: (Количество) N = x S 2 При заданном КВ 20 %, S 2 = 0, Тогда N (количество) = Надо округлить до следующего парного числа: 36 Плюс например еще 4 дополнительных испытуемых в случае выбывания
Training workshop: Training of BE assessors, Kiev, October | Как рассчитать КВ на основе 90% ДИ в исследовании по БЭ
Training workshop: Training of BE assessors, Kiev, October | Пример расчета КВ на основе 90%-го ДИ При заданном ДИ 90%: от до в исследовании по БЭ с количеством N=24 Преобразование в логарифм 90% ДИ: от до Среднее значение этих крайних величин и есть точечная оценка: Обратно преобразовываем в изначальную шкалу e = Ширина в логарифмической шкале составит – = 0,1530 Используя объем выборки, считаем t-величину. Как? –На основе аналитических таблиц Стьюдента-t или компьютера (MS Excel)
Training workshop: Training of BE assessors, Kiev, October | Пример расчета КВ на основе 90%-го ДИ При заданном количестве N = 24, степени свободы составят 22 t = РАСПРЕД.T.INV(0.1;n-2) = Стандартная ошибка разности (SE (d) ) = Ширина / t-значение = / = 0,0891 Возводим это квадрат: = 0,0079 и делим полученное на 2 = 0,0040 Умножаем его на объем выборки: x24 = 0,0953 = СКЭ КВ (%) = 100 x (e СКЭ -1) = 100 x (e ) = 31,63 %