Способы оценки результатов в медицинской статистике
Доверительные интервалы используются для оценки частоты ремиссий во II фазе испытаний и для выявления и оценки различий между группами в III фазе испытаний. Это интервал, в котором с заданной вероятностью (обычно 95%) находится истинное значение показателя. Чем больше больных включено в испытание, тем уже доверительный интервал, то есть тем выше вероятность, что полученное значение показателя соответствует истинному. Чем выше частота ремиссий, полученная в данном испытании, тем выше вероятность, что высока и истинная частота ремиссий.
Процентные показатели используют для сравнения вероятности благоприятных исходов (ремиссия, выживаемость) в экспериментальной и контрольной группах.
Доверительные интервалы для процентных показателей позволяют рассчитать интервал, в котором с заданной вероятностью (обычно 95%) находится истинная разница между группами. Метод дает количественную оценку различий между двумя группами и используется для одно- и двусторонних сравнений.
Сравнение процентных показателей позволяет с заданной вероятностью (обычно 95%) исключить ложноположительный результат, но не дает количественной оценки различий между фуппами. Статистическую значимость различий оценивают с помощью критерия хи(греч) в квадрате или, что предпочтительнее, точного критерия Фишера; для полученных значений этих критериев определяют значение Р.
Ошибка I рода (альфа) - это ложноположительный результат (если бы в выборку были включены все больные, то различия между группами исчезли бы). Вероятность ошибки I рода описывается величиной Р. Обычно различия считают статистически значимыми, если Р меньше 0,05. При Р=0,05 вероятность того, что различия между группами случайны, составляет 5%. Величина 5% в какой-то мере произвольна, она соответствует 95% доверительному интервалу, или двум стандартным отклонениям. При небольшом числе больных или коротком периоде наблюдения значение Р неприменимо. Предварительные расчеты Р, выполненные до получения данных по всем больным, часто выявляют несуществующие различия между группами и не должны приниматься во внимание, пока число больных не будет достаточным.
Ошибка II рода (бета) - это ложноотрицательный результат (если бы в выборку были включены все больные, то различия между группами появились бы). В публикациях этот показатель обычно не указывается, так как он учитывается при планировании исследования, чтобы определить число больных, необходимое для получения статистически значимых результатов.
Односторонние критерии и двусторонние критерии. Односторонний критерий дает значение Р для гипотезы о том, что экспериментальное лечение лучше стандартного. Однако результаты в экспериментальной группе могут быть такими же или даже худшими, чем в контрольной. Для учета этих возможностей используют двусторонние критерии.
Чувствительность критерия равна (1-бета). Публикуемые результаты, основанные на небольшом числе больных, обычно имеют Р менее 0,05 и выглядят положительными. Однако по мере увеличения числа больных и срока наблюдения значение Р обычно увеличивается. Чтобы результаты исследования были доступны для интерпретации и имели практическое значение, оно должно иметь заранее определенные число больных и период наблюдения. Чувствительность критерия зависит от числа больных: чем она выше, тем с большей уверенностью можно утверждать, что наблюдаемые различия между группами не случайны.
Смотрите также: