Яндекс.Метрика Проверка нормальности и сравнение групповых средних

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
".
Д. Дидро

Статистика посещаемости БИОМЕТРИКИ

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
Популярные страницы посещаемые читателями

http://www.biometrica.tomsk.ru/index.htm
http://www.biometrica.tomsk.ru/biostat_1.htm
http://www.biometrica.tomsk.ru/biostat_2.htm
http://www.biometrica.tomsk.ru/biostat_3.htm
http://www.biometrica.tomsk.ru/biostat_4.htm

http://www.biometrica.tomsk.ru/biostat_5.htm
http://www.biometrica.tomsk.ru/biostat_6.htm

http://www.biometrica.tomsk.ru/biostat_7.htm
http://www.biometrica.tomsk.ru/biostat_8.htm
http://www.biometrica.tomsk.ru/biostat_9.htm
http://www.biometrica.tomsk.ru/biostat_10.htm

http://www.biometrica.tomsk.ru/biostat_11.htm
http://www.biometrica.tomsk.ru/nauka_33.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/nauka_19.htm
http://www.biometrica.tomsk.ru/logit_0.htm
http://www.biometrica.tomsk.ru/stat_cardio_1998.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/leonov_vak.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/biometrica_18.htm

Сравниваем средние, а также и ...

В. Леонов

 

Читай не затем, чтобы противоречить и опровергать;
не затем, чтобы принимать на веру;
и не затем, чтобы найти предмет для беседы;
но чтобы мыслить и рассуждать.
____________
Фрэнсис Бэкон


Оглавление

  1. Нормально и не нормально…
  2. Как возникает нормальное и не нормальное распределение
  3. А сколько этих взаимозависимостей?
  4. Сравниваем средние, дисперсии,  и т.д.
  5. Что сравнивать в корреляции и регрессии?
  6. Заключение. Список литературы

 


 

А сколько этих взаимозависимостей?

 

В современной медицине всё более
широкое применение стали получать
математические, количественные исследования.
_______________
Хрусталёв Ю.М

 

 Количество таких видов парных зависимостей, приведено в виде формул в статье [51].  «Отметим, что в подобных исследованиях часть признаков являются количественными, например, рост и вес пациента, артериальные давления, результаты анализа крови, и т.п. А другие признаки являются дискретными, качественными. Например, пол пациента, группа крови, состояние здоровья (больной/здоровый), исход лечения, и т.п. Введём условные обозначения количественных признаков как  KOj , а качественных признаков как KAi . Пусть в исследовании используются следующие количественные признаки:  KO1 ,  KO2 , KO3 , ...,  KOj , ..., KOf ,...,  KOm. А список качественных признаков следующий:  KA1 ,  KA2 , KA3 , ...,  KAi , ..., KAk ,...,  KAn. В этом случае число парных связей между качественными  n признаками равно:

А число парных связей между m количественными признаками равно:

Наконец число парных связей между качественными признаками KAi и количественными признаками KOj равно произведению n*m.

Общее количество парных связей OS равно:

Вот как можно представить графически этих 3 слагаемых, содержащих количество парных зависимостей между n количественными признаками, между m качественными признаками, и между n качественными и m количественными признаками:

  

На этом графике цветом выделены те клетки, в которых пересекаются строки и столбцы с разными, неидентичными признаками. Например, пары типа KOj ~ KOfKAi ~ KAk ;   KAi ~  KOf . Также не выделены цветом те клетки, в которых пересекаются строки и столбцы с идентичными признаками, типа KOj ~ KOj ; KAi ~ KAi . Также не выделены цветом те клетки, в которых размещены дубли комбинаций качественных и количественных признаков типа KAi ~  KOf   ».

    Для демонстрации продуктивности анализа упомянутых выше парных связей признаков, приведём несколько примеров, полученных при выполнении нами анализа данных, собранных несколькими исследователями. Упомянутый выше массив данных исследователя G.L. (Германия), содержал 32 количественных признака, и 24 качественных признаков, представленных в 708 наблюдениях.

    Используя приведённые выше формулы, получаем, что количество парных взаимосвязей между количественными признаками равно 32*(32-1)/2=16*31=496. Число парных взаимосвязей между качественными признаками равно 24*(24-1)/2=12*23=276. А количество парных связей между одним количественным и одним качественным признаком (или между одним качественным и одним количественным признаком), равно 32*24=768. Таким образом, общее количество парных взаимосвязей подлежащих исследованию, равно: 496+276+768=1540. Это же самое количество парных взаимозависимостей можно было получить, произведя следующее вычисление: (32+24)*(32+24-1)/2= 56*55/2=28*55=1540.

    Естественно, что при оценке такого количества парных взаимосвязей возникает вопрос:  а следует ли оценивать, проверять наличие всех этих зависимостей? Ответ зависит как от основных целей и задач исследования, так и от самого количества подобных парных связей. Другим аргументом, при выборе этого решения, является уровень производительности используемой технологии статистического анализа. Поэтому при выполнении простейшей, элементарной  цели исследования, ограниченной очень малым количеством задач исследования, можно ограничиться и малым количеством исследуемых взаимосвязей, для которых достаточно лишь подтвердить или опровергнуть наличие неких зависимостей. Чаще всего в подобных исследованиях ограничиваются лишь сравнением групповых средних. Естественно, что в этом случае невозможно получение неких новых результатов, позволяющих сгенерировать новые структуры изучаемых явлений, и сформулировать некоторые новые гипотезы и интерпретации о механизмах исследуемых явлений.

    В тоже время, если данный анализ выполняется профессиональным статистиком, использующим технологии написания программ статистического анализа различными языками программирования, то очевидно, что в этом случае следует выполнять максимальные объёмы подобных анализов. И при изучении полученных при этом большого количества результатов самим исследователем, медиком или биологом, и т.д., с помощью профессионального биостатистика, им будут обнаружены весьма оригинальные и ранее неизвестные механизмы и модели исследуемых явлений. Тем более что уровень профессионального статистика позволяет при этом применять гораздо более сложные и более продуктивные методы анализа, о которых исследователь либо только слышал об их наличии, либо вообще познакомится с ними впервые.

Отношение к этой особенности проводимых исследований, по своей сути, показывает отношение самого исследователя к принципам доказательной медицины. Ограничение лишь 1-2 статистическими гипотезами, или зависимостями,  свидетельствует отрицание им важности всех остальных потенциально значимых зависимостей, как раз и являющихся проекциями методов доказательной медицины. Однако подобные ограничения до 1-2 проверяемых гипотез, чаще всего, авторы никак не аргументируют.

Итак, аргументация оценки большинства этих зависимостей следующая.  Во-первых, опыт анализа собираемых данных показывает, что далеко не все взаимосвязи, формулируемые на основе отдельных экспериментов или наблюдений, в действительности оказываются статистически значимыми. То есть часть зависимостей будет статистически значимой, а остальные – статистически незначимыми. Соотношения значимых и не значимых зависимостей, в исследованиях различаются. Однако чаще всего доля статистически значимых зависимостей менее 50%. Поэтому, если подобные статистически значимые зависимости встречаются реже, то для их нахождения требуется производить больше проверок. Но при этом не менее важно и определение отсутствия взаимной зависимости между конкретными признаками, предполагаемые как причины и следствия. Поскольку в этом случае появляется возможность целенаправленного изменения одного из этих признаков, без его влияния на второй признак. Либо одновременного изменения обоих признаков в нужных направлениях. То есть подобная "автономность" такой пары признаков, позволяет производить независимые друг от друга изменения в нужных направлениях.

    Во-вторых, для статистически значимых взаимосвязей весьма важен показатель интенсивности этих зависимостей. Используя эти показатели, данные взаимосвязи могут быть упорядочены, проранжированы по этим интенсивностям. Очевидно, что в первую очередь следует производить интерпретацию самых сильных, самых интенсивных взаимосвязей. А также устанавливать природу этих зависимостей, выделяя в этих парах признаков причинные характеристики, и признаки, которые по своей сути являются следствиями вариабельности причинных характеристик. Либо устанавливать тот факт, что оба признака являются следствиями неких иных признаков. И в этом случае переход к иным, третьим признакам, порождает из набора парных взаимозависимостей многомерную зависимость из 3-х и более признаков. В нашем докладе [50], мы приводим в качестве примера изображение большого набора потенциальных взаимосвязей (парных и многомерных). Этот пример приведён ниже на графике:

     В-третьих, проверка статистической значимости всех, как парных, так и многомерных зависимостей, в итоге устанавливает гораздо меньшее количество зависимостей, которые  следует интерпретировать, чтобы далее использовать их в генерируемых лечебных технологиях. Ниже на графике показан пример такого существенного ограничения количества надёжных и полезных зависимостей. В частности, из десятков возможных многомерных зависимостей, представленных на графике выше, были установлены лишь 3 статистически значимые многомерные зависимости. При этом две из них отражали статистически значимую взаимосвязь состояния «Больной» с другими признаками. И только одна зависимость отражала статистически значимую зависимость состояния «Здоровый» с остальными признаками.

     Очевидно, что статистически значимые зависимости могут быть использованы для формирования модели изучаемых явлений. А такая модель явления необходима для управления ею, чтобы получить в итоге желаемые результаты. При этом данные зависимости можно проранжировать, упорядочить по уменьшению интенсивности этих связей. То есть выбрать из них самые сильные зависимости, затем более слабые, и т.д. И такой выбор весьма  важен для построения механизмов более эффективной коррекции важнейших показателей состояния здоровья пациентов. 

Напомним, что генерирование, создание проектов моделей различных исследуемых явлений, имеет 2 различных подхода. Во-первых, на основе экспериментальной информации, в том числе по собранным данным об исследуемых пациентах, формулируют новые предположения, гипотезы об имеющихся системах заболеваний, лечении, организмах, и т.п. Но при этом, не используя статистического анализа, а используя лишь ранее известные модели, механизмы, и расширяя их собственными представлениями на основе собранных результатов.

Следующий подход создания моделей, структур новых исследуемых явлений, состоит в установлении причинно-следственных взаимосвязей, включая их направленности, с помощью различных методов статистического анализа собранных данных. То есть в попытках установить, какой из признаков является причиной, а какой – следствием. Либо оба признака являются следствиями иных причинных признаков. Наконец, для этих статистически значимых взаимосвязей важно установить, какие признаки является изменяемыми теми или иными методами в проводимом исследовании. А какие признаки не могут быть изменяемыми. Например, признаки анамнеза, пол пациента, возраст, и т.п.


Далее: Сравниваем средние, дисперсии,  и т.д.

Примеры оформления заказчиками базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1  Пример 2   Пример 3


  НЦ БИОСТАТИСТИКА
выполняет статистический анализ данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Нашими услугами пользуются аспиранты и докторанты по медицине, биологии, социологии, психологии и т.д. (См. далее )

Отзывы исследователей по статистическому анализу данных


Интересная ссылка


Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками.


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

Роль «малых» доз ионизирующего излучения в развитии неонкологических эффектов: гипотеза или реальность? Бюллетень сибирской медицины, № 2, 2005, с. 63-70. Карпов А.Б., Семенова Ю.В., , Тахауов Р.М., Литвиненко Т.М., Попов С.В., Леонов В.П.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Логистическая регрессия в медицине и биологии.
Леонов В.

В серии 10 статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

Введение.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии.


Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.

В. Леонов. КЛАССИФИКАЦИЯ ОШИБОК ПРИМЕНЕНИЯ СТАТИСТИКИ В ОТЕЧЕСТВЕННОЙ МЕДИЦИНЕ.


В. Леонов. МЕМЕТИЧЕСКИЙ АНАЛИЗ СТАТИСТИЧЕСКИХ ЗАБЛУЖДЕНИЙ В ПУБЛИКАЦИЯХ НАУЧНЫХ ШКОЛ

Леонов В.П. Введение в семиотику информационных технологий: учебное пособие. – Томск: Изд-во НТЛ, 2011. – 248 с. Учебное пособие является первой книгой из серии учебных пособий по современным проблемам информатики, подготавливаемых на факультете информатики ТГУ. Книга предназначена для студентов как естественных, так и гуманитарных факультетов, изучающих информатику. Изложены основные понятия семиотики как одной из составляющих частей информатики. Рассмотрены классификации знаков и их свойств, в частности мобильность и ареальность, а также изменение природы носителей информации. 5-я глава - "Статистическая структура информационных массивов".

Леонов В.П. Обработка экспериментальных данных на программируемых микрокалькуляторах.

Леонов В.П. Введение в физику и технологию элементной базы ЭВМ и компьютеров.

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. Почему появилась эта статья? За время существования сайта БИОМЕТРИКА его автору пришло довольно много писем, в которых читатели консультировались относительно различных нюансов использования и описания методов статистики в статьях и диссертациях. Этот поток писем периодически возрастал после публикаций статей автора на сопутствующие темы в "Бюллетене ВАК РФ",  "Международном журнале медицинской практики",  "Медицинской газете",  "Сибирском медицинском журнале", а также непосредственно на сайте БИОМЕТРИКА. С каждым годом таких писем становится все больше...

Леонов В.П. Общие проблемы применения статистики в биомедицине. 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Факторный анализ: основные положения и ошибки применения.

История биометрики

Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ 
ДЛЯ МЕДИКОВ И БИОЛОГОВ. 

(время и опыт)
. Леонов В.

Общие проблемы применения статистики в биомедицине,  или что разумнее: ДДПП или ДППД?

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.
Ошибка – это …
Ошибка или обман?

Обзоры ошибок применения статистики в медицине

Причины возникновения ошибок и меры борьбы с ними

Ошибки описания статистических методов

Меметический анализ описаний методов статистики

Локализация ошибочных описаний внутри научных школ

Мемы камуфляжных описаний

Смутно пишут о том, о чём смутно представляют

Коварный t-критерий Стьюдента

«… не зная законов языка ирокезского, можешь ли ты делать такое суждение  по  сему предмету…»

Что же делать, чтобы избежать ошибок?


1997 - 2019.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"