Яндекс.Метрика Проверка нормальности и сравнение групповых средних

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
". Д. Дидро

Статистика посещаемости БИОМЕТРИКИ Яндекс
цитирования
Индекс цитирования

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
Яндекс
цитирования
Яндекс цитирования
 

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят...


Введение
Наши возможности. О возможностях статистического анализа
Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35
Список научных и учебных изданий по биометрике и статистике
Материалы по науковедению
История биометрики
Статистическое рецензирование статей и диссертаций

Долгое прощание с лысенковщиной...
Семинар по биометрике в Красноярске



Если Вы сторонник использования
статистики, разместите на своём сайте
HTML-код нашего баннера:

BIOMETRICA - журнал для сторонников доказательной биологии и медицины
25 наиболее популярных ссылок, посещаемых нашими читателями
http://www.biometrica.tomsk.ru/comp_aver.htm
http://www.biometrica.tomsk.ru/erevan_8.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/UNESCO%202010.pdf
http://www.biometrica.tomsk.ru/zakaz.htm
http://www.biometrica.tomsk.ru/zakaz_28.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/STAT_CARDIO_2014.pdf
http://www.biometrica.tomsk.ru/logit_9.htm
http://www.biometrica.tomsk.ru/stat_cardio7.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/percent_00.htm
http://www.biometrica.tomsk.ru/lis.htm
http://www.biometrica.tomsk.ru/kamchat.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/zakaz_15.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

Сравниваем средние, а также и ...

В. Леонов

Читай не затем, чтобы противоречить и опровергать;
не затем, чтобы принимать на веру;
и не затем, чтобы найти предмет для беседы;
но чтобы мыслить и рассуждать.
____________
Фрэнсис Бэкон


Оглавление

  1. Нормально и не нормально…
  2. Как возникает нормальное и не нормальное распределение
  3. А сколько этих взаимозависимостей?
  4. Сравниваем средние, дисперсии,  и т.д.
  5. Что сравнивать в корреляции и регрессии?
  6. Заключение. Список литературы

 


Что сравнивать в корреляции и регрессии?

 

Метод - самая первая, основная вещь…
От метода, от способа действия зависит
вся серьёзность исследования.
Все дело в хорошем методе…
Метод держит в руках судьбу исследования.
_______________________________

Иван Петрович Павлов

 

Особенности распределения наблюдений, описываемых парой количественных признаков, также может описываться разными параметрами. Наиболее часто вначале используется оценка коэффициентов корреляции.  Для пары количественных признаков эти разные показатели интенсивности взаимосвязи имеют модули своих значений от 0 до 1. Как и для предыдущей пары признаков, значение равное 0 означает отсутствие взаимосвязи. А значение равное 1 означает наличие функциональной взаимосвязи. Для выбора вида используемого коэффициента корреляции, необходимо вначале с помощью двумерного графика отобразить структуру этой потенциальной связи. Поскольку помимо линейной связи, для оценки интенсивности которой используется коэффициент корреляции Пирсона, анализируемая связь может быть и сугубо нелинейной. Ниже приведены 3 графика, отражающие такие особенности. На первом графике приведена типичная линейная взаимосвязь между парой признаков.  

 

 

 

 

А на двух следующих графиках показано, что если использовать коэффициент линейной корреляции, без проверки типа зависимости между парой признаков с помощью графики, то устанавливается отсутствие связи двух признаков. Однако на графике отчётливо видна  сугубо нелинейная взаимосвязь.

Поэтому при использовании коэффициента корреляции для нелинейной связи между этой парой признаков, фиксируется статистически значимая и весьма интенсивная взаимосвязь.

 

 

Аналогичная методика сообщит и об огромном количестве парных взаимосвязей между количественными переменными, которые могут быть исследованными для различных градаций группирующих признаков. В таких ситуациях для выбора анализа подобных взаимосвязей оптимально использование следующего подхода. Вначале составляется список тех взаимосвязей, которые сформулированы априори в виде цели и задачи проводимого исследования. Например, исследовать изменение параметров конкретных количественных признаков (среднее, доверительный интервал для среднего, дисперсия, и т.д.) для пациентов в результате лечения. Естественно, что для этого реально можно (и нужно!) применять разные методы статистического анализа.


А для выбора апостериори анализов взаимосвязей, следует сделать много полезных для выбора графиков. Это графики выражающие связи между количественным и качественным признаком, между парами количественных признаков, а также между парами количественных признаков с учётом одного или более качественных признаков. Использование такого графического этапа полезно с использованием специальных пакетов анализа. И при визуальном обнаружении таких взаимосвязей, далее применять уже различные методы статистического анализа, в том числе и методы сравнения не только средних значений. С учётом описанной выше оценки вариантов комбинаций разных признаков, по упомянутому массиву данных исследователя G.L., было сделано 10 тысяч графиков. При просмотре этих графиков были выбраны те комбинации признаков, на которых достаточно ясно отражалось наличие взаимосвязи между признаками. Ниже приводится несколько графиков для некоторых комбинаций признаков, и обсуждается специфика дальнейшего их анализа.  

   На этом графике приведено распределение наблюдений упомянутого массива данных в осях HB и SP. Видно наличие линейной корреляции между этой парой признаков, для которой статистически значимый коэффициент корреляции Пирсона r = 0,8883. Также приведено в заголовке графика уравнение парной линейной регрессии SP = 49,8492 + 0,4671*HB. На графике приведена красная линия регрессии по данному уравнению.

   Для этой пары признаков было также построено 24 графика с указанием принадлежности наблюдений к конкретным градациям каждого группирующего признака. Ниже приведён один из таких графиков, с использованием группирующего признака GES.

На этом графике видно, что все три группы наблюдений, выделенные разными цветами точек (наблюдений), лишь частично перекрываются друг с другом. Тогда как средние значения признаков HB и SP в этих группах существенно различаются. Ниже в таблице приведены средние значения двух этих признаков.

GES Переменная N Среднее Стандартное отклонение Дисперсия Коэффициент вариации, %
1 SP 234 120,25 4,68 26,90 3,89
1 HB 234 159,01 10,19 103,84 6,41
2 SP 234 132,56 6,00 36,00 4,43
2 HB 234 168,85 8,71 75,86 5,16
3 SP 240 146,50 7,75 60,06 5,29
3 HB 240 207,03 13,93 194,04 6,73

 

Исходя из расположений этих трёх групп, была произведена проверка статистических гипотез
H0: µ1= µ2= µ3 ; H1: µ1µ2µ3 для признаков HB и SP. Естественно, что предварительно для каждой из этих трёх групп была проведена проверка гипотез нормального распределения этих признаков. Оказалось, что в группе GES=1 оба признака не имели нормального распределения. Тогда как в остальных двух группах у одного признака не было нормального распределения. Поэтому для проверки приведённых выше статистических гипотез использовались непараметрические критерии Ван дер Вардена, Краскела-Валлиса, а также медианный критерий. Результаты их применения привели к принятию гипотезы неравенства средних групповых всех трёх групп: H1: µ1µ2µ3. После чего были проведены также проверки равенства центральных параметров для пар групп: 1-2; 1-3; 2-3. И для всех этих трёх парных групп нулевые гипотезы также были отклонены. А с помощью критериев Сиджела-Тьюки и Ансари-Брэдли  также были отклонены гипотезы равенства трёх групповых дисперсий. На выбранных графиках, количеством порядка 1 тысячи, ясно отражалось наличие взаимосвязи между признаками. И по ним также были проведены аналогичные анализы.

Поскольку в каждой из трёх этих групп видно наличие линейной корреляции между признаками HB и SP, то целесообразно выполнить раздельно по каждой из трёх групп корреляционный и регрессионный анализ. Ниже приведены 4 графика как с общим расположением трёх групп, так и с раздельным их расположением. Также в этих графиках изменяются признаки в горизонтальных осях X и вертикальных осях Y. Это делается для демонстрации идентичности при этом коэффициентов корреляции rxy и ryx, и различия между уравнением SP = b0 + b1* HB и уравнением HB = c0 + c1* SP.


Если сравнить полученные для каждой из трёх групп результаты корреляционного анализа, то видно, что имеются некоторые существенные различия. Так для группы GES=1 коэффициент корреляции Пирсона r1=0,7818. И для группы GES=2 этот коэффициент корреляции почти такой же: r2=0,7700.
Тогда как для группы GES=3 коэффициент корреляции существенно меньше: r3=0,5816.

Итак, сравнение этих коэффициентов корреляции показало, что максимальные коэффициенты линейной корреляции в 1-й и 2-й группах, а минимальная корреляция в 3-й группе. Поэтому целесообразно произвести сравнение этих коэффициентов корреляции. То есть произвести проверку следующих статистических гипотез о равенстве коэффициентов корреляции групп 1-3 и 2-3:
H0: ρ1= ρ3 ;   H1: ρ1 ≠ ρ3 ;
H0: ρ2= ρ3 ;   H1: ρ2 ≠ ρ3 ;

Весьма подробное описание проверки подобных гипотез приведено в [82] на страницах 197-199.
Данная проверка показала, что коэффициенты корреляции между группами 1-3 и 2-3 отличаются статистически значимо (р < 0,0001). Тогда как между группами 1-2 эти коэффициенты не различаются статистически значимо. То есть в группах GES=1 и GES=2 имеется более сильная взаимосвязь между признаками HB и SP, нежели в группе GES=3.

Внимательное изучение уравнений парной регрессии для этих трёх групп, показывает, что в этих уравнениях не идентичны как свободные члены уравнений α, так и регрессионные коэффициенты β . На графиках с горизонтальной осью HB и вертикальной осью SP, представлены три следующих уравнения:
GES: 1 SP = 63,2956 + 0,3588 * HB
GES: 2 SP = 42,9818 + 0,5305 * HB
GES: 3 SP = 79,5093 + 0,3236 * HB

Причём на том графике, где представлены все три группы GES, отчётливо видно, что выделенная красным цветом линия регрессии для группы GES=2, имеет угол наклона самый большой из этих трёх групп. Соответственно и коэффициент регрессии у этого уравнения, равный 0,5305 , больше чем соответствующие коэффициенты в группах GES=1 и GES=3. То есть в группе GES=2, при увеличении признака HB на 10 единиц, наиболее вероятное изменение признака SP равно 5,305. Тогда как в группе GES=1 такое изменение составит 3,588 , а в группе GES=3 это изменение составит 3,236. Поэтому целесообразно произвести сравнение этих коэффициентов регрессии. То есть сделать проверку следующих статистических гипотез о равенстве коэффициентов регрессии групп 1-2 и 3-2:

H0: β1= β2 ;   H1: β1 ≠ β2 ;

H0: β3= β2 ;   H1: β3 ≠ β2 ;


Описание проверки подобных гипотез приведено в [82] на страницах 206-212.
Данная проверка показала, что коэффициенты регрессии между группами 1-2 и 3-2 отличаются статистически значимо (р < 0,0001). Тогда как между группами 1-3 эти коэффициенты не различаются статистически значимо. То есть в группах GES=1 и GES=2 имеется более сильная взаимосвязь между признаками HB и SP, нежели в группе GES=3.

Различие регрессионных коэффициентов в сравниваемых группах весьма важно. В том случае, когда значения зависимой переменной Y являются результатами изменений причинной переменной (предиктора) X, то коэффициент регрессии сказывается на величине дисперсии зависимой переменной Y. Например, в двух группах получены два следующих регрессионных уравнения: Y1 = a1 + b1*X , и Y2 = a2 + b2 *X.

Если два регрессионных коэффициента статистически значимо различаются, и b1 > b2 , то линия регрессии в первом уравнении будет иметь больший угол, нежели во втором уравнении с меньшим значением регрессионного коэффициента. Поэтому при одном и том же интервале изменений предиктора X, интервал значений зависимой переменной Y в первом уравнении будет существенно больше, и, соответственно, дисперсии зависимой переменной Y в двух сравниваемых группах будут весьма существенно отличаться. Поэтому неравенство дисперсий в сравниваемых группах, может быть результатом разных причин, в том числе и результатом различия регрессионных коэффициентов. Ниже приведён график с уравнениями линейной регрессии для двух групп по упомянутому массиву данных исследователя G.L.

По графику видим, что в обеих группах признак SP имеет равные интервалы изменения. Тогда как интервалы изменения и дисперсии признака AMD, отличаются в этих двух группах весьма существенно. Поскольку в первой группе коэффициент регрессии равен 2,1107, а во второй группе аналогичный коэффициент равен 0,9287. При этом коэффициенты корреляции отличаются немного, и гипотеза о равенстве этих корреляционных коэффициентов не отвергается.


Ниже в двух таблицах представлены дескриптивные статистики обоих признаков в двух сравниваемых группах.

    С помощью критерия Шапиро-Уилка подтверждена нормальность распределения обоих признаков в двух группах сравнения. Поэтому для признака AMD используем F-критерий Фишера-Снедекора, равный отношению двух дисперсий: F=553,2455 / 126,1906 = 4,384. По таблице F-распределения находим уровень статистической значимости для F=4,384; p < 0,0001. То есть принимается гипотеза неравенства дисперсий данного признака в двух сравниваемых группах. Следовательно, неравенство коэффициентов регрессии приводит и к неравенству дисперсий.

   Существенное различие интервалов и дисперсий изменения признаков может объясняться не только различием регрессионных коэффициентов, но и видами регрессионных зависимостей. Например, в одной группе это линейная зависимость, а в другой группе сравнения та же парная зависимость оказывается сугубо нелинейной. Например, регрессия описывается уравнением 2-й или 3-й степени, либо экспоненциальной зависимостью, и т.п.

    Важность сравнения дисперсий актуальна не только при сравнении разных групп, но и при использовании многих иных методов статистического анализа. Так популярной задачей исследований является оценка множественного уравнения регрессии. В этом случае может использоваться большое количество различных регрессионных моделей. Например, множественные линейные уравнения регрессии, множественные нелинейные уравнения регрессии, уравнения типа производственной функции Кобба-Дугласа, и т.д.

    Из получаемого набора регрессионных уравнений для достижения поставленных целей, выбирают одно или несколько наиболее ценных и полезных уравнений. Мотивация такого выбора содержит, как правило, несколько деталей. Это и составы вошедших в уравнения признаков-предикторов, возможности целенаправленных изменений этих предикторов, значения стандартизованных коэффициентов предикторов, и т.д. Но при этом важнейшим показателем адекватности полученной зависимости является минимизация дисперсии значений ошибок  ei = Yi – Ÿi . Где Yi   – фактическое значение зависимой переменной для i-того наблюдения, а Ÿi– значение, предсказанное по конкретному уравнению. То есть выбор тех уравнений регрессии, в которых предсказанные значения наиболее близки к фактическим значениям зависимой переменной.

  Получая наборы подобных ошибок  ei , несложно вычислить их дисперсию по каждому из сравниваемых уравнений. Ну а далее следует производить проверку статистических гипотез о равенстве этих дисперсий, выбрав в конечном итоге то уравнение, в котором дисперсия ошибок самая маленькая. Разумеется, при реализации этих методов оценки уравнений можно использовать и метод генерации пробных подвыборок, по которым оцениваются уравнения, и производить их проверку на оставшихся частях выборок. Напомню, что в этой акции опять же первоначально следует проверять распределение получаемых ошибок на нормальный закон. И на основе полученного результата выбирать соответствующие статистические критерии для проверки гипотез о равенстве дисперсий.

    Поскольку в этих случаях возможно наличие одного или нескольких аномальных значений зависимой переменной, т.е. наблюдений с «выбросами»,  то для каждого уравнения регрессии при проверке нормальности распределения ошибок, также следует использовать для наблюдений оценки дистанции Mahalanobis и Cook's.  Сравнивая эти дистанции отдельных наблюдений, можно установить имеющиеся аномальные наблюдения, и произвести повторные оценки уравнений регрессии без этих наблюдений. И последующие сравнения будут произведены как для дисперсий ошибок сравниваемых уравнений, так и для коэффициентов уравнений, и множественных коэффициентов корреляции.

   Достаточно подробно аспекты выбора наилучших вариантов уравнений регрессии описаны в монографиях [23, 82]. Основное содержание данной статьи посвящено особенностям сравнения разных параметров одного или двух количественных признаков. Однако в реальных исследованиях число анализируемых количественных признаков всегда более одного. То есть анализируются от двух и более количественных признаков. При этом, кроме количественных признаков всегда используются и группирующие качественные признаки. В начале данной статьи мы уже обращали внимание на то, что в статьях, диссертациях и монографиях по медицине и биологии, доминируют сравнения групповых средних. В том числе не только с помощью t-критерия Стьюдента, но и параметрического и непараметрического дисперсионного анализа.

     Поскольку число количественных признаков в этих сравниваемых группах более одного, то логично использовать и многомерные сравнения. Например, сравнение векторов, координаты которых оцениваются для каждой из групп сравнения. Данный метод называется многомерным дисперсионным анализом (Multivariate Analysis of Variance – MANOVA). Весьма подробно эта технология описана в книге [4]. Этот метод MANOVA не следует путать с многофакторным дисперсионным анализом ANOVA, в котором производится сравнение групповых средних одной количественной переменной, но с учётом наличия более одного группирующего признака (фактора). С примерами использования различных методов статистического анализа, можно познакомиться в подборке публикаций, список которых приведён по этому адресу. 

    В подобных ситуациях важно не только сравнивать групповые вектора, но также и все наблюдения этих групп. Каждое из этих наблюдений описывается набором значений количественных и качественных признаков. При сравнении групп, в которых наблюдения описываются только количественными признаками, весьма продуктивно применяется метод дискриминантного анализа. Причём у данного метода достаточно большое количество вариантов реализации. Поэтому для получения оптимального результата следует использовать гораздо больше одного из этих вариантов. Продуктивное сравнение многомерных групп, наблюдения которых описываются как количественными, так и качественными признаками, производится с помощью метода логистической регрессии. Отличные примеры использования дискриминантного анализа и логистической регрессии приведены в диссертациях, представленных на первой странице нашего сайта БИОМЕТРИКА. А описание метода логистической регрессии приведено в 9 наших статьях, список которых приведён на первой странице сайта БИОМЕТРИКА. Следующая, 10-я статья этой серии, будет содержать описание других специфик использования этого метода, с примерами в стоматологических исследованиях.

    Подобно сравнению уравнений множественной регрессии, необходимо продуктивно сравнивать и результаты, получаемые в методе логистической регрессии. Как и во всех прочих многомерных методах, в данном методе также используются разные алгоритмы оценки уравнений. Основные отличия этих алгоритмов отражаются в структуре оцениваемых уравнений, в методах отбора признаков-предикторов, в особенностях представления группирующих признаков при отборе признаков-предикторов, в значениях критических уровней статистической значимости, задаваемых при пошаговых процедурах отбора предикторов, и т.д. Выше мы уже обсуждали, что показателем адекватности уравнения множественной регрессии, является минимизация дисперсии разностей между фактическим и предсказанным значением  ei = Yi – Ÿi.

   Однако в отличии от стандартной множественной регрессии, в логистической регрессии производится сравнение двух и более групп наблюдений. То есть, используя полученное уравнение логистической регрессии, вычисляются вероятности отнесения каждого конкретного наблюдения к каждой из сравниваемых групп. И в этом случае оценку адекватности получаемых уравнений логистической регрессии подобным методом минимизации дисперсий ошибок производить не реально. Во-первых, поскольку с использованием разных алгоритмов также получаются наборы разных уравнений логистической регрессии. Однако при этом разные уравнения могут предсказывать вероятности отнесения конкретных наблюдений не ко всем к сравниваемым группам. То есть получить аналогичные разности вероятности фактической, и вероятности прогнозируемой по уравнению логистической регрессии, возможно не для всех групп сравнения. Поскольку это связано также и с назначением критического уровня вероятности отнесения анализируемых наблюдений к конкретной группе сравнения. Аналогичный аспект имеется и в другом подобном многомерном методе сравнения групп – в дискриминантном анализе.

   Ниже приведены фрагменты двух примеров использования метода логистической регрессии [52], по которым обсуждаются возможные сравнения полученных групповых параметров. При сравнении двух групп наблюдений по массиву G.J.H., с помощью метода логистической регрессии, было получено 30 уравнений. По одному из этих уравнений значение Percent Concordant  было равно 97,8%,  а значение Somers' D  было равно 0,937. Ниже в таблице представлены средние значения параметра BETA, и средние вероятности отнесения наблюдений в сравниваемые группы, полученные в данном уравнении.

Сравнение средних значений параметров (последний столбец таблицы) показывает, что максимальное значение модуля параметра BETA в группе 1, равное 8,6905034. И средняя вероятность отнесения анализируемых 272 наблюдений в свою группу 1, также высока, и равна 0,9480942. Тогда как аналогичные средние значения по группе 2 существенно меньше.

Далее в таблице сопряжённости представлены по обеим сравниваемым группам частоты наблюдений (пациентов) фактические и предсказанные. Видно, что наибольшая доля правильно предсказанной, по уравнению логистической регрессии, принадлежности наблюдений к конкретной группе, характерна для наблюдений группы «А=1». В частности, полученное уравнение логистической регрессии из 272 наблюдений группы «А=1» отнесло в эту же самую группу 266 наблюдений. И лишь 6 наблюдений было отнесено в группу «А=2». Тогда как, соответственно, минимальная доля классификации наблюдений в свою же собственную группу, характерна для наблюдений группы «А=2».

И для данной таблицы сопряжённости значение V-Крамера равно 0,7504.

    В серии статей о логистической регрессии [52], показано, что помимо уравнений в результатах анализа можно получать для каждого наблюдения сравниваемых групп конкретные значения параметра BETA и вероятности отнесения каждого наблюдения в любую из сравниваемых групп. И в этом случае продолжением сравнения групп может стать сравнение комбинаций значений предикторов, вошедших в уравнение, для наблюдений, относимых по уравнению, как в свою собственную группу, так и в другую группу. Благодаря этому сравнению можно установить, за счёт значений каких наиболее важных предикторов конкретное наблюдение переклассифицировано не свою группу, а в другую. При этом отметим, что более простая технология такого сравнения для случая двух анализируемых групп. И более сложное сравнение в том случае, когда число групп более двух.

    Ниже представлены аналогичные результаты по массиву G.J.H., когда оценивались уравнения логистической регрессии при сравнении трёх групп. При этом было получено 26 уравнений. По одному из этих уравнений значение Percent Concordant было равно 98,1%, а значение Somers' D было равно 0,943. В следующей таблице представлены средние значения параметра BETA, и средние вероятности отнесения наблюдений в сравниваемые группы.
(N.B.! Выражение типа 8,56E-9 означает 8,56 *10-9    )

   Ниже в таблице сопряжённости представлены по трём сравниваемым группам частоты фактические и предсказанные. Видно, что наибольшая доля правильно предсказанных по уравнению логистической регрессии, характерна для наблюдений группы «А=2». Тогда как, соответственно, минимальная доля характерна для наблюдений группы «А=3».

   Ранее мы уже предлагали сравнивать комбинации значений предикторов для тех наблюдений, которые по уравнению логистической регрессии были переклассифицированы в свою группу. Однако при наличии не двух, а более групп, подобное сравнение этих наблюдений уже значительно сложнее. Детали подобных сравнений мы обсудим в 10-й статье по логистической регрессии, в которой будут приведены примеры использования этого метода в стоматологических исследованиях.

     Итак, процедуры сравнения отдельных параметров получаемых с помощью метода логистической регрессии, более сложны, но при этом более продуктивны, нежели простые сравнения групповых средних.


Далее: Заключение. Список литературы




 

 

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Отзывы заказчиков по статистическому анализу данных

Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками.


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.


23 примера оформления данных, их описания и описания целей исследования


В ноябре 2013 года сайту БИОМЕТРИКА исполнилось 16 лет. А что было раньше? И что теперь?

БИОМЕТРИКЕ - 18 лет! 19 ноября 2015 года нашему сайту исполнилось 18 лет с момента его создания. За прошедший год произошло очень много общения со специалистами в медицине и биологии из разных городов и стран. По их просьбе была продолжена серия статей по логистической регрессии. Также было выполнено много работы по статистическому анализу собранных ими данных...


Примеры отличных результатов статистического анализа в диссертациях, дипломных работах и статьях, полученных с нашей помощью.

Д.С. Симанков. Применение метода логистической регрессии для факторов риска, влияющих на исход операции в условиях искусственного кровообращения. (статья)

В.В. Половинкин. Тотальная мезоректумэктомия — фактор повышения эффективности лечения среднеампулярного и нижнеампулярного рака прямой кишки.  (диссертация на соискание учёной степени доктора медицинских наук)

Н.Г. Веселовская.  Клиническое и прогностическое значение эпикардиального ожирения у пациентов высокого сердечно-сосудистого риска.  (диссертация на соискание учёной степени доктора медицинских наук)

О.Я. Васильцева. Закономерности возникновения, клинического течения и исходов тромбоэмболии легочной артерии по данным госпитального регистра патологии.  (диссертация на соискание учёной степени доктора медицинских наук)

В.А. Габышев.  Фитопланктон крупных рек Якутии и сопредельных территорий восточной Сибири.  (диссертация на соискание учёной степени доктора биологических наук)

М.И. Антоненко.  Гиперкортицизм без специфических клинических симптомов:
эпидемиология, клиника, диагностика
.  (диссертация на соискание учёной степени кандидата медицинских наук)

Study of the Factors Influencing Mortality from the Cerebral Stroke in Patients of Different Ages.
Vazgen Martirosyan1 and Julia Krupskaya, Department of Nervous Diseases and Neurosurgery, Rostov State Medical University, Rostov-on-Don 344000, Russia. British Journal of Medicine & Medical Research, 3(4): 1530-1557, 2013.

Попова Г.А. Сравнительное изучение подвидов LINUM USITATISSIMUM L . в условиях Западной  Сибири (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина. Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).


Роль «малых» доз ионизирующего излучения в развитии неонкологических эффектов: гипотеза или реальность? Бюллетень сибирской медицины, № 2, 2005, с. 63-70. Карпов А.Б., Семенова Ю.В., , Тахауов Р.М., Литвиненко Т.М., Попов С.В., Леонов В.П.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.

В.В. Мартиросян, Ю.А. Долгушева. Анализ влияния гелиогеофизических и метеорологических факторов на инсульты с учётом фаз солнечного цикла. Ростовский государственный медицинский университет. – Ростов н/Д.: Изд-во"АкадемЛит" (ИП Ковтун С.А.) 2014г. 414 с.


Неравнодушные!
Приглашаем в ДИССЕРНЕТ!
Это не про науку.
Это про репутацию и вран
ьё

DisserNet

Сетевое сообщество "Диссернет" заявило о наличии заимствований в диссертации главы Минсельхоза Александра Ткачева. Результаты экспертизы опубликованы на сайте проекта.

ВАК вынужден идти навстречу Диссернету. Это очень трудно — заставить ВАК исполнять закон и следовать морали. Но многое получается. Присоединяйтесь к Диссернету — это важнейшее дело, которое вы можете сделать для русской науки.

ЮНЕСКО отмечает снижение вклада России в мировую науку. ЮНЕСКО после пятилетнего перерыва опубликовала доклад по науке до 2030 года. Статистические показатели для России ухудшились по сравнению с большинством ведущих научных стран, несмотря на то, что многие данные взяты из официальных российских источников.

Что губит российскую науку и как с этим бороться. Георгий Георгиев, академик РАН, координатор программы РАН «Молекулярная и клеточная биология». В этой статье рассматривается вопрос, почему все эти виды открытой науки в нашей стране отстают и что надо сделать для их прогресса.

«РОССИЯ БЕЗ НАУКИ — ТРУБА». 29 мая 2015 года в Москве прошла третья сессия Конференции научных работников. Публикуем несколько выступлений, прозвучавших на этом форуме.

Георгий Базыкин. Неолысенковщина, финансируемая
государством
. При принятии решений о том, что является наукой, а что — лженаукой, государству стоило бы посоветоваться с учёными.

Плохая наука.
НЕКОРРЕКТНЫЕ ИССЛЕДОВАНИЯ
ПРИВОДЯТ К ЛОЖНОМУ ЗНАНИЮ, ИНОГДА —
ГИБЕЛИ ЛЮДЕЙ

ПОЛОВИНУ ОТКРЫТЫХ НАУЧНЫХ ЖУРНАЛОВ НАЗВАЛИ «МУСОРОМ» ... Результат был ошеломляющим: 157 журналов приняли заведомо «бракованные» статьи к публикации, причем около 80 из них даже не подвергали их должной проверке. Отвергли статьи 98 журналов, а остальные к настоящему моменту не успели принять решения. ...«Журналы без контроля качества деструктивны, особенно для развивающихся стран, где правительственные учреждения и университеты заполнены людьми с фальшивыми научными званиями»

Международная сеть агентств по оценке медицинских технологий

Отзывы на
авторефераты и
диссертации

Диссертационные войны. Как борьба с плагиатом в диссертациях переместилась из науки в политику

ВЛАДИМИР ФИЛИППОВ. «Закрутим гайки – и пена уйдет». Интервью с председателем ВАК Владимиром Филипповым.

Дело о крови и лимфе. "Диссернет" всерьёз занялся врачами

Доказательная медицина: история, эволюция, роль в медицине

В.В. Фадеев. Представление данных в оригинальных работах и их статистическая обработка.
Проблемы эндокринологии – 2002 - Т. 48, N 3. – С. 47 – 48.

Авторский ресурс Зорина Н.А.


После взрыва на СХК в 1993г. в Томске и Северске увеличилась частота рождения детей с пороками развития

В новый век - с доказательной биомедициной
Газета ПОИСК, № 20 (522)
21 мая 1999
г.


Долгое прощание
с
лысенковщиной 

История науки не ограничивается перечислением успешных исследований. Она должна сказать нам о безуспешных исследованиях и объяснить, почему некоторые из самых способных людей не могли найти ключа знания, и как репутация других дала лишь большую опору ошибкам, в которые они впали.

Дж. Максвелл 

Функциональный кризис отечественной науки, переживаемый в последнее десятилетие, вынуждает беспристрастно анализировать основные причины этого явления [1-2, 45-47]. Последние результаты библиометрического анализа говорят о том, что вклад России в мировую науку по основным направлениям составляет уже порядка 5-8% [1-2]. По данным того же источника вклад США составляет 32-41%. 

Коммунистическая идеология, уродовавшая многие направления отечественной науки на потребу вождей, породила и такое явление, как лысенковщина. Для большинства читателей фамилия Лысенко ассоциируется с августовской сессией ВАСХНИЛ 1948 г. и разгромом генетики. Однако лысенковщину нельзя сводить только к запрету на генетику. Достигнув своего апогея в середине текущего века, и став воистину периодом средневековья в отечественной биологии и медицине, лысенковщина изуродовала и методологию этих наук, изгнав из них в частности математику, и в первую очередь статистику. Последствия этого уродства и по сей день не позволяют биологии и медицине приблизиться к статусу точных наук. В статье описаны основные этапы этого явления и особенности методологии применения статистики в биологии и медицине, полученные автором при анализе нескольких сот диссертаций и монографий а также более 1500 статей в области экспериментальной биомедицины. 


Автор понимает, что поднятая им проблема достаточно обширна и не может быть полностью освещена в одной статье, содержащей лишь малую часть материалов готовящейся к изданию монографии, посвященной проблемам применения статистики в медицине и биологии. Автор будет признателен читателям, которые выскажут свой взгляд на эту проблему, а также смогут дополнить авторские материалы новыми примерами.  Обсуждаемая в данной статье проблема может быть решена только общими усилиями всех заинтересованных в этом специалистов.

Работая над этой статьей, мне довелось несколько раз встречаться с одним из ректоров медицинского вуза. Обсуждая с ним предлагаемые в статье меры, направленные на исправление этого неприглядного положения, я с изумлением услышал от него такой ответ: "Как ученый - я "За", а как ректор - "Против"! И если так мыслит и говорит ректор, доктор медицинских наук, член-корреспондент РАМН, то несложно понять отношение к этой проблеме рядовых сотрудников такого вуза. Не потому ли многие из них представлены в разделе КУНСТКАМЕРА, вместе с моим собеседником, своими диссертациями и статьями...

За те несколько лет, что прошли с момента публикации этой статьи, а также статей  "В новый век - с доказательной биомедициной"(ПОИСК, N 20 (522) 21 мая 1999) и "Куплю 500 диссертаций! (Медицинская Газета N10 за 14.02.2001)", практически ничего не изменилось. Да, в России стали писать и говорить о доказательной медицине, проводить конференции по этой тематике, а в некоторых медицинских вузах даже открыли центры доказательной медицины. Однако откроем биомедицинские журналы и диссертации, и станет ясно, что это не более чем дань моде... 

Материалы по науковедению

В новый век - с доказательной биомедициной

Кунсткамера
Один из моих коллег по Томскому госуниверситету долгое время собирал коллекцию под названием "Бредотека". В ней он коллекционировал разнообразные примеры бредовых идей, сообщений и высказываний. Другие собирают аналогичные коллекции под названием "Абсурдотека". Свою коллекцию образцов статистической некорректности, а подчас и невежества, мы решили назвать "Кунсткамера".
Открыт зал экспонатов журнала "Бюллетень экспериментальной биологии и медицины". Подведены итоги конкурса на эпиграфы к этому разделу

Новый экспонат КУНСТКАМЕРЫ: Диссертация Порываевой О.В., Барнаул, 2004 г. "...Полагаю, что отмеченных выше недостатков уже более чем достаточно, чтобы обратиться в ВАК РФ с предложением о повторном изучениии данной работы в экспертном совете ВАК.

Обновление раздела КУНСТКАМЕРА - диссертации "Содержание микронутриентов у школьников г. Сургута", "Организационно-методические условия оздоровительных занятий студенток специальной медицинской группы с диагнозом нейроциркуляторная дистония", Сургутский государственный университет.


Как две капли воды... Удивительные совпадения встречаются подчас в текстах журнальных статей, диссертаций и книг разных авторов. Этому феномену и посвящён данный раздел, который открывает ЭКСПЕРИМЕНТАЛЬНО-МЕДИЦИНСКАЯ ГАВРИЛИАДА".
Вы ко мне писали... (Переписка с нашими читателями)
- Выпуск 2
- Выпуск 1


1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"