Яндекс.Метрика Таблицы сопряженности и вычисление статистики Хи-квадрат
Анализ таблиц сопряженности с вычислением
критерия Хи-квадрат и статистик связи


   Эта статья была подготовлена автором еще в1998г. и
ожидала своей очереди для размещения на "Биометрике".
Поводом для ее нынешнего появления послужила просьба
начальника управления здравоохранением г. Томска
д.м.н.А.Т.Адамяна, высказанная им при обсуждении
 анализа результатов  использования бициллина в лечении
болезни Лайме.

В.Леонов. (16.05.2000)



     Анализ качественных признаков может достаточно широко применяться в биомедицинских исследованиях, поскольку примерно треть используемых в медицине и биологии признаков имеют качественную природу. Еще в 1900г. один из основателей современной статистики и всемирно известного журнала "Biometrika",  английский биолог и математик Карл Пирсон, в статье опубликованной в "Философских трудах Лондонского королевского общества" (английская Академия наук), привел изящное выражение для анализа корреляции между качественными признаками. Простейшая таблица для этого случая называется таблицей сопряженности 2х2 и имеет следующий вид:
 
Признак А
Признак В
 
Наличие B
Отсутствие B
Всего
Наличие A
a
b
a+b
Отсутствие A
c
d
c+d
Всего
a+c
b+d
N=a+b+c+d

Для таблицы 2х2  статистика хи-квадрат, с помощью которой проверяется статистическая гипотеза о наличии взаимосвязи между двумя качественными признаками, вычисляется по следующему выражению:

.
    В 1934г. Иэйтс (Yates F.) предложил ввести в данное выражение так называемую поправку на непрерывность, которая связана с тем, что непрерывные распределения хи-квадрат и соответственно нормальное распределение, используются для представления дискретных выборочных частот. С учетом такой поправки данное выражение примет следующий вид:

.

    Отметим, что отсутствие поправки на непрерывность приводит к увеличению значения статистики хи-квадрат и, соответственно, уменьшению величины достигнутого уровня значимости. Этот эффект имеет два последствия. С одной стороны, это приводит к более частому отклонению нулевой гипотезы и принятию гипотезы о наличии взаимосвязи между двумя качественными признаками когда связи нет. Одновременно это снижает мощность критерия Хи-квадрат, т.е. уменьшает вероятность обнаружения существующей зависимости, или существующего различия в частотах в тех случаях, когда они есть. Обратим внимание наших  читателей на то, что в публикациях, как и в статистических пакетах, не всегда сообщается какое именно выражение используется для оценки статистики хи-квадрат, что затрудняет для читателя адекватную оценку надежности  результатов автора публикации. Поэтому мы рекомендуем нашим читателям всегда указывать в своих публикациях использовалась ли поправка на непрерывность при оценке критерия хи-квадрат. Наиболее важно это в тех случаях, когда величина достигнутого уровня значимости этого критерия "р" находится вблизи критичного уровня, обычно принимаемого равным 5%. Ниже на конкретном примере мы покажем как влияет наличие поправки на непрерывность на величину этой статистики.

    Для более обстоятельного знакомства с многочисленными методами анализа качественных признаков рекомендуем следующие издания:
1. Справочник по прикладной статистике. В 2-х т. Т.1: Пер. с англ./ Под ред. Э.Ллойда, У.Ледермана, Ю.Н.Тюрина. - М.: Финансы и статистика, 1989. - 510 с.
2. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Пер. с англ. - М.: Мир, 1982. - 488с.
3. П.Мюллер, П.Нойман, Р.Шторм. Таблицы по математической статистике / Пер. с нем. - М.: Финансы и статистика, 1982 - 278 с.
4. Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа: Руководство для экономистов/ Пер. с нем.  -М.: Финансы и статистика, 1983. - 302с.
5. К.Браунли. Статистическая теория и методология в науке и технике /Пер. с англ. - М.: "Наука", 1977. - 407с.
6. Власов В.В. Эффективность диагностических  исследований. - М.: Медицина, 1988.  - 256c.
7. Statistical Methods for Rates and Proportions (2nd Ed.) by Joseph L. Fleiss (Pub: John Wiley & Sons, New York, 1981)
8. Леонов В.П. Обработка экспериментальных данных на программируемых микрокалькуляторах (Прикладная статистика на Б3-34, МК-52, МК-56, МК-61). - Томск: Изд-во Томского университета, 1990. - 376с.
9. Р.Флетчер, С.Флетчер, Э.Вагнер. Клиническая эпидемиология. Основы доказательной медицины. Пер. с англ. - М.: МедиаСфера, 1998. - 352с.

    Другие интересные издания по анализу качественных признаков вы можете найти в нашем аннотированном указателе литературы по биометрике и статистике.
   Используя приведенные ниже таблицы  наши читатели смогут получить основные результаты анализа таблиц сопряженности не производя самостоятельно все вычисления, а всего лишь подставив собственные данные и нажав кнопку "Вычислить"...



Вычисление статистики хи-квадрат (без поправки Иэйтса на непрерывность) для таблицы сопряженности 2х2.

Вычисление статистики хи-квадрат  для таблицы сопряженности 2х2 и достигнутого уровня значимости (с поправкой Иэйтса на непрерывность). Кроме того производится оценка отношения шансов, относительного риска, индекса Каппа, чувствительности, специфичности, прогностичности положительного результата, прогностичности отрицательного результата и границ 95% -ных доверительных интервалов для этих статистик связи.



© 1997 - 2018 Василий Леонов

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ.
Rambler's Top100