Яндекс.Метрика Проверка нормальности и сравнение групповых средних

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
".
Д. Дидро

Статистика посещаемости БИОМЕТРИКИ

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
Популярные страницы посещаемые читателями

http://www.biometrica.tomsk.ru/index.htm
http://www.biometrica.tomsk.ru/biostat_1.htm
http://www.biometrica.tomsk.ru/biostat_2.htm
http://www.biometrica.tomsk.ru/biostat_3.htm
http://www.biometrica.tomsk.ru/biostat_4.htm

http://www.biometrica.tomsk.ru/biostat_5.htm
http://www.biometrica.tomsk.ru/biostat_6.htm

http://www.biometrica.tomsk.ru/biostat_7.htm
http://www.biometrica.tomsk.ru/biostat_8.htm
http://www.biometrica.tomsk.ru/biostat_9.htm
http://www.biometrica.tomsk.ru/biostat_10.htm

http://www.biometrica.tomsk.ru/biostat_11.htm
http://www.biometrica.tomsk.ru/nauka_33.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/nauka_19.htm
http://www.biometrica.tomsk.ru/logit_0.htm
http://www.biometrica.tomsk.ru/stat_cardio_1998.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/leonov_vak.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/biometrica_18.htm

Сравниваем средние, а также и ...

В. Леонов

Читай не затем, чтобы противоречить и опровергать;
не затем, чтобы принимать на веру;
и не затем, чтобы найти предмет для беседы;
но чтобы мыслить и рассуждать.
____________
Фрэнсис Бэкон


Оглавление

  1. Нормально и не нормально…
  2. Как возникает нормальное и не нормальное распределение
  3. А сколько этих взаимозависимостей?
  4. Сравниваем средние, дисперсии,  и т.д.
  5. Что сравнивать в корреляции и регрессии?
  6. Заключение. Список литературы

 


Что сравнивать в корреляции и регрессии?

 

Метод - самая первая, основная вещь…
От метода, от способа действия зависит
вся серьёзность исследования.
Все дело в хорошем методе…
Метод держит в руках судьбу исследования.
_______________________________

Иван Петрович Павлов

 

Особенности распределения наблюдений, описываемых парой количественных признаков, также может описываться разными параметрами. Наиболее часто вначале используется оценка коэффициентов корреляции.  Для пары количественных признаков эти разные показатели интенсивности взаимосвязи имеют модули своих значений от 0 до 1. Как и для предыдущей пары признаков, значение равное 0 означает отсутствие взаимосвязи. А значение равное 1 означает наличие функциональной взаимосвязи. Для выбора вида используемого коэффициента корреляции, необходимо вначале с помощью двумерного графика отобразить структуру этой потенциальной связи. Поскольку помимо линейной связи, для оценки интенсивности которой используется коэффициент корреляции Пирсона, анализируемая связь может быть и сугубо нелинейной. Ниже приведены 3 графика, отражающие такие особенности. На первом графике приведена типичная линейная взаимосвязь между парой признаков.  

 

 

 

 

А на двух следующих графиках показано, что если использовать коэффициент линейной корреляции, без проверки типа зависимости между парой признаков с помощью графики, то устанавливается отсутствие связи двух признаков. Однако на графике отчётливо видна  сугубо нелинейная взаимосвязь.

Поэтому при использовании коэффициента корреляции для нелинейной связи между этой парой признаков, фиксируется статистически значимая и весьма интенсивная взаимосвязь.

 

 

Аналогичная методика сообщит и об огромном количестве парных взаимосвязей между количественными переменными, которые могут быть исследованными для различных градаций группирующих признаков. В таких ситуациях для выбора анализа подобных взаимосвязей оптимально использование следующего подхода. Вначале составляется список тех взаимосвязей, которые сформулированы априори в виде цели и задачи проводимого исследования. Например, исследовать изменение параметров конкретных количественных признаков (среднее, доверительный интервал для среднего, дисперсия, и т.д.) для пациентов в результате лечения. Естественно, что для этого реально можно (и нужно!) применять разные методы статистического анализа.


А для выбора апостериори анализов взаимосвязей, следует сделать много полезных для выбора графиков. Это графики выражающие связи между количественным и качественным признаком, между парами количественных признаков, а также между парами количественных признаков с учётом одного или более качественных признаков. Использование такого графического этапа полезно с использованием специальных пакетов анализа. И при визуальном обнаружении таких взаимосвязей, далее применять уже различные методы статистического анализа, в том числе и методы сравнения не только средних значений. С учётом описанной выше оценки вариантов комбинаций разных признаков, по упомянутому массиву данных исследователя G.L., было сделано 10 тысяч графиков. При просмотре этих графиков были выбраны те комбинации признаков, на которых достаточно ясно отражалось наличие взаимосвязи между признаками. Ниже приводится несколько графиков для некоторых комбинаций признаков, и обсуждается специфика дальнейшего их анализа.  

   На этом графике приведено распределение наблюдений упомянутого массива данных в осях HB и SP. Видно наличие линейной корреляции между этой парой признаков, для которой статистически значимый коэффициент корреляции Пирсона r = 0,8883. Также приведено в заголовке графика уравнение парной линейной регрессии SP = 49,8492 + 0,4671*HB. На графике приведена красная линия регрессии по данному уравнению.

   Для этой пары признаков было также построено 24 графика с указанием принадлежности наблюдений к конкретным градациям каждого группирующего признака. Ниже приведён один из таких графиков, с использованием группирующего признака GES.

На этом графике видно, что все три группы наблюдений, выделенные разными цветами точек (наблюдений), лишь частично перекрываются друг с другом. Тогда как средние значения признаков HB и SP в этих группах существенно различаются. Ниже в таблице приведены средние значения двух этих признаков.

GES Переменная N Среднее Стандартное отклонение Дисперсия Коэффициент вариации, %
1 SP 234 120,25 4,68 26,90 3,89
1 HB 234 159,01 10,19 103,84 6,41
2 SP 234 132,56 6,00 36,00 4,43
2 HB 234 168,85 8,71 75,86 5,16
3 SP 240 146,50 7,75 60,06 5,29
3 HB 240 207,03 13,93 194,04 6,73

 

Исходя из расположений этих трёх групп, была произведена проверка статистических гипотез H0: µ1= µ2= µ3 ; H1: µ1µ2µ3 для признаков HB и SP. Естественно, что предварительно для каждой из этих трёх групп была проведена проверка гипотез нормального распределения этих признаков. Оказалось, что в группе GES=1 оба признака не имели нормального распределения. Тогда как в остальных двух группах у одного признака не было нормального распределения. Поэтому для проверки приведённых выше статистических гипотез использовались непараметрические критерии Ван дер Вардена, Краскела-Валлиса, а также медианный критерий. Результаты их применения привели к принятию гипотезы неравенства средних групповых всех трёх групп: H1: µ1µ2µ3. После чего были проведены также проверки равенства центральных параметров для пар групп: 1-2; 1-3; 2-3. И для всех этих трёх парных групп нулевые гипотезы также были отклонены. А с помощью критериев Сиджела-Тьюки и Ансари-Брэдли  также были отклонены гипотезы равенства трёх групповых дисперсий. На выбранных графиках, количеством порядка 1 тысячи, ясно отражалось наличие взаимосвязи между признаками. И по ним также были проведены аналогичные анализы.

Поскольку в каждой из трёх этих групп видно наличие линейной корреляции между признаками HB и SP, то целесообразно выполнить раздельно по каждой из трёх групп корреляционный и регрессионный анализ. Ниже приведены 4 графика как с общим расположением трёх групп, так и с раздельным их расположением. Также в этих графиках изменяются признаки в горизонтальных осях X и вертикальных осях Y. Это делается для демонстрации идентичности при этом коэффициентов корреляции rxy и ryx,  
и различия между уравнением SP = b0 + b1* HB и уравнением HB = c0 + c1* SP.


Если сравнить полученные для каждой из трёх групп результаты корреляционного анализа, то видно, что имеются некоторые существенные различия. Так для группы GES=1 коэффициент корреляции Пирсона r1=0,7818. И для группы GES=2 этот коэффициент корреляции почти такой же: r2=0,7700.
Тогда как для группы GES=3 коэффициент корреляции существенно меньше: r3=0,5816.

Итак, сравнение этих коэффициентов корреляции показало, что максимальные коэффициенты линейной корреляции в 1-й и 2-й группах, а минимальная корреляция в 3-й группе. Поэтому целесообразно произвести сравнение этих коэффициентов корреляции. То есть произвести проверку следующих статистических гипотез о равенстве коэффициентов корреляции групп 1-3 и 2-3:
H0: ρ1= ρ3 ;   H1: ρ1 ≠ ρ3 ;
H0: ρ2= ρ3 ;   H1: ρ2 ≠ ρ3 ;

Весьма подробное описание проверки подобных гипотез приведено в [82] на страницах 197-199.


Данная проверка показала, что коэффициенты корреляции между группами 1-3 и 2-3 отличаются статистически значимо (р < 0,0001). Тогда как между группами 1-2 эти коэффициенты не различаются статистически значимо. То есть в группах GES=1 и GES=2 имеется более сильная взаимосвязь между признаками HB и SP, нежели в группе GES=3.

Внимательное изучение уравнений парной регрессии для этих трёх групп, показывает, что в этих уравнениях не идентичны как свободные члены уравнений α, так и регрессионные коэффициенты β . На графиках с горизонтальной осью HB и вертикальной осью SP, представлены три следующих уравнения:
GES: 1 SP = 63,2956 + 0,3588 * HB
GES: 2 SP = 42,9818 + 0,5305 * HB
GES: 3 SP = 79,5093 + 0,3236 * HB

Причём на том графике, где представлены все три группы GES, отчётливо видно, что выделенная красным цветом линия регрессии для группы GES=2, имеет угол наклона самый большой из этих трёх групп. Соответственно и коэффициент регрессии у этого уравнения, равный 0,5305 , больше чем соответствующие коэффициенты в группах GES=1 и GES=3. То есть в группе GES=2, при увеличении признака HB на 10 единиц, наиболее вероятное изменение признака SP равно 5,305. Тогда как в группе GES=1 такое изменение составит 3,588 , а в группе GES=3 это изменение составит 3,236. Поэтому целесообразно произвести сравнение этих коэффициентов регрессии. То есть сделать проверку следующих статистических гипотез о равенстве коэффициентов регрессии групп 1-2 и 3-2:

H0: β1= β2 ;   H1: β1 ≠ β2 ;

H0: β3= β2 ;   H1: β3 ≠ β2 ;


Описание проверки подобных гипотез приведено в [82] на страницах 206-212.
Данная проверка показала, что коэффициенты регрессии между группами 1-2 и 3-2 отличаются статистически значимо (р < 0,0001). Тогда как между группами 1-3 эти коэффициенты не различаются статистически значимо. То есть в группах GES=1 и GES=2 имеется более сильная взаимосвязь между признаками HB и SP, нежели в группе GES=3.

Различие регрессионных коэффициентов в сравниваемых группах весьма важно. В том случае, когда значения зависимой переменной Y являются результатами изменений причинной переменной (предиктора) X, то коэффициент регрессии сказывается на величине дисперсии зависимой переменной Y. Например, в двух группах получены два следующих регрессионных уравнения: Y1 = a1 + b1*X , и Y2 = a2 + b2 *X.

Если два регрессионных коэффициента статистически значимо различаются, и b1 > b2 , то линия регрессии в первом уравнении будет иметь больший угол, нежели во втором уравнении с меньшим значением регрессионного коэффициента. Поэтому при одном и том же интервале изменений предиктора X, интервал значений зависимой переменной Y в первом уравнении будет существенно больше, и, соответственно, дисперсии зависимой переменной Y в двух сравниваемых группах будут весьма существенно отличаться. Поэтому неравенство дисперсий в сравниваемых группах, может быть результатом разных причин, в том числе и результатом различия регрессионных коэффициентов. Ниже приведён график с уравнениями линейной регрессии для двух групп по упомянутому массиву данных исследователя G.L.

По графику видим, что в обеих группах признак SP имеет равные интервалы изменения. Тогда как интервалы изменения и дисперсии признака AMD, отличаются в этих двух группах весьма существенно. Поскольку в первой группе коэффициент регрессии равен 2,1107, а во второй группе аналогичный коэффициент равен 0,9287. При этом коэффициенты корреляции отличаются немного, и гипотеза о равенстве этих корреляционных коэффициентов не отвергается.


Ниже в двух таблицах представлены дескриптивные статистики обоих признаков в двух сравниваемых группах.

    С помощью критерия Шапиро-Уилка подтверждена нормальность распределения обоих признаков в двух группах сравнения. Поэтому для признака AMD используем F-критерий Фишера-Снедекора, равный отношению двух дисперсий: F=553,2455 / 126,1906 = 4,384. По таблице F-распределения находим уровень статистической значимости для F=4,384; p < 0,0001. То есть принимается гипотеза неравенства дисперсий данного признака в двух сравниваемых группах. Следовательно, неравенство коэффициентов регрессии приводит и к неравенству дисперсий.

   Существенное различие интервалов и дисперсий изменения признаков может объясняться не только различием регрессионных коэффициентов, но и видами регрессионных зависимостей. Например, в одной группе это линейная зависимость, а в другой группе сравнения та же парная зависимость оказывается сугубо нелинейной. Например, регрессия описывается уравнением 2-й или 3-й степени, либо экспоненциальной зависимостью, и т.п.

    Важность сравнения дисперсий актуальна не только при сравнении разных групп, но и при использовании многих иных методов статистического анализа. Так популярной задачей исследований является оценка множественного уравнения регрессии. В этом случае может использоваться большое количество различных регрессионных моделей. Например, множественные линейные уравнения регрессии, множественные нелинейные уравнения регрессии, уравнения типа производственной функции Кобба-Дугласа, и т.д.

    Из получаемого набора регрессионных уравнений для достижения поставленных целей, выбирают одно или несколько наиболее ценных и полезных уравнений. Мотивация такого выбора содержит, как правило, несколько деталей. Это и составы вошедших в уравнения признаков-предикторов, возможности целенаправленных изменений этих предикторов, значения стандартизованных коэффициентов предикторов, и т.д. Но при этом важнейшим показателем адекватности полученной зависимости является минимизация дисперсии значений ошибок  ei = Yi – Ÿi . Где Yi   – фактическое значение зависимой переменной для i-того наблюдения, а Ÿi– значение, предсказанное по конкретному уравнению. То есть выбор тех уравнений регрессии, в которых предсказанные значения наиболее близки к фактическим значениям зависимой переменной.

  Получая наборы подобных ошибок  ei , несложно вычислить их дисперсию по каждому из сравниваемых уравнений. Ну а далее следует производить проверку статистических гипотез о равенстве этих дисперсий, выбрав в конечном итоге то уравнение, в котором дисперсия ошибок самая маленькая. Разумеется, при реализации этих методов оценки уравнений можно использовать и метод генерации пробных подвыборок, по которым оцениваются уравнения, и производить их проверку на оставшихся частях выборок. Напомню, что в этой акции опять же первоначально следует проверять распределение получаемых ошибок на нормальный закон. И на основе полученного результата выбирать соответствующие статистические критерии для проверки гипотез о равенстве дисперсий.

    Поскольку в этих случаях возможно наличие одного или нескольких аномальных значений зависимой переменной, т.е. наблюдений с «выбросами»,  то для каждого уравнения регрессии при проверке нормальности распределения ошибок, также следует использовать для наблюдений оценки дистанции Mahalanobis и Cook's.  Сравнивая эти дистанции отдельных наблюдений, можно установить имеющиеся аномальные наблюдения, и произвести повторные оценки уравнений регрессии без этих наблюдений. И последующие сравнения будут произведены как для дисперсий ошибок сравниваемых уравнений, так и для коэффициентов уравнений, и множественных коэффициентов корреляции.

   Достаточно подробно аспекты выбора наилучших вариантов уравнений регрессии описаны в монографиях [23, 82]. Основное содержание данной статьи посвящено особенностям сравнения разных параметров одного или двух количественных признаков. Однако в реальных исследованиях число анализируемых количественных признаков всегда более одного. То есть анализируются от двух и более количественных признаков. При этом, кроме количественных признаков всегда используются и группирующие качественные признаки. В начале данной статьи мы уже обращали внимание на то, что в статьях, диссертациях и монографиях по медицине и биологии, доминируют сравнения групповых средних. В том числе не только с помощью t-критерия Стьюдента, но и параметрического и непараметрического дисперсионного анализа.

     Поскольку число количественных признаков в этих сравниваемых группах более одного, то логично использовать и многомерные сравнения. Например, сравнение векторов, координаты которых оцениваются для каждой из групп сравнения. Данный метод называется многомерным дисперсионным анализом (Multivariate Analysis of Variance – MANOVA). Весьма подробно эта технология описана в книге [4]. Этот метод MANOVA не следует путать с многофакторным дисперсионным анализом ANOVA, в котором производится сравнение групповых средних одной количественной переменной, но с учётом наличия более одного группирующего признака (фактора). С примерами использования различных методов статистического анализа, можно познакомиться в подборке публикаций, список которых приведён по этому адресу. 

    В подобных ситуациях важно не только сравнивать групповые вектора, но также и все наблюдения этих групп. Каждое из этих наблюдений описывается набором значений количественных и качественных признаков. При сравнении групп, в которых наблюдения описываются только количественными признаками, весьма продуктивно применяется метод дискриминантного анализа. Причём у данного метода достаточно большое количество вариантов реализации. Поэтому для получения оптимального результата следует использовать гораздо больше одного из этих вариантов. Продуктивное сравнение многомерных групп, наблюдения которых описываются как количественными, так и качественными признаками, производится с помощью метода логистической регрессии. Отличные примеры использования дискриминантного анализа и логистической регрессии приведены в диссертациях, представленных на первой странице нашего сайта БИОМЕТРИКА. А описание метода логистической регрессии приведено в 10 наших статьях, список которых приведён на первой странице сайта БИОМЕТРИКА.

    Подобно сравнению уравнений множественной регрессии, необходимо продуктивно сравнивать и результаты, получаемые в методе логистической регрессии. Как и во всех прочих многомерных методах, в данном методе также используются разные алгоритмы оценки уравнений. Основные отличия этих алгоритмов отражаются в структуре оцениваемых уравнений, в методах отбора признаков-предикторов, в особенностях представления группирующих признаков при отборе признаков-предикторов, в значениях критических уровней статистической значимости, задаваемых при пошаговых процедурах отбора предикторов, и т.д. Выше мы уже обсуждали, что показателем адекватности уравнения множественной регрессии, является минимизация дисперсии разностей между фактическим и предсказанным значением  ei = Yi – Ÿi.

   Однако в отличии от стандартной множественной регрессии, в логистической регрессии производится сравнение двух и более групп наблюдений. То есть, используя полученное уравнение логистической регрессии, вычисляются вероятности отнесения каждого конкретного наблюдения к каждой из сравниваемых групп. И в этом случае оценку адекватности получаемых уравнений логистической регрессии подобным методом минимизации дисперсий ошибок производить не реально. Во-первых, поскольку с использованием разных алгоритмов также получаются наборы разных уравнений логистической регрессии. Однако при этом разные уравнения могут предсказывать вероятности отнесения конкретных наблюдений не ко всем к сравниваемым группам. То есть получить аналогичные разности вероятности фактической, и вероятности прогнозируемой по уравнению логистической регрессии, возможно не для всех групп сравнения. Поскольку это связано также и с назначением критического уровня вероятности отнесения анализируемых наблюдений к конкретной группе сравнения. Аналогичный аспект имеется и в другом подобном многомерном методе сравнения групп – в дискриминантном анализе.

   Ниже приведены фрагменты двух примеров использования метода логистической регрессии [52], по которым обсуждаются возможные сравнения полученных групповых параметров. При сравнении двух групп наблюдений по массиву G.J.H., с помощью метода логистической регрессии, было получено 30 уравнений. По одному из этих уравнений значение Percent Concordant  было равно 97,8%,  а значение Somers' D  было равно 0,937. Ниже в таблице представлены средние значения параметра BETA, и средние вероятности отнесения наблюдений в сравниваемые группы, полученные в данном уравнении.

Сравнение средних значений параметров (последний столбец таблицы) показывает, что максимальное значение модуля параметра BETA в группе 1, равное 8,6905034. И средняя вероятность отнесения анализируемых 272 наблюдений в свою группу 1, также высока, и равна 0,9480942. Тогда как аналогичные средние значения по группе 2 существенно меньше.

Далее в таблице сопряжённости представлены по обеим сравниваемым группам частоты наблюдений (пациентов) фактические и предсказанные. Видно, что наибольшая доля правильно предсказанной, по уравнению логистической регрессии, принадлежности наблюдений к конкретной группе, характерна для наблюдений группы «А=1». В частности, полученное уравнение логистической регрессии из 272 наблюдений группы «А=1» отнесло в эту же самую группу 266 наблюдений. И лишь 6 наблюдений было отнесено в группу «А=2». Тогда как, соответственно, минимальная доля классификации наблюдений в свою же собственную группу, характерна для наблюдений группы «А=2».

И для данной таблицы сопряжённости значение V-Крамера равно 0,7504.

    В серии статей о логистической регрессии [52], показано, что помимо уравнений в результатах анализа можно получать для каждого наблюдения сравниваемых групп конкретные значения параметра BETA и вероятности отнесения каждого наблюдения в любую из сравниваемых групп. И в этом случае продолжением сравнения групп может стать сравнение комбинаций значений предикторов, вошедших в уравнение, для наблюдений, относимых по уравнению, как в свою собственную группу, так и в другую группу. Благодаря этому сравнению можно установить, за счёт значений каких наиболее важных предикторов конкретное наблюдение переклассифицировано не свою группу, а в другую. При этом отметим, что более простая технология такого сравнения для случая двух анализируемых групп. И более сложное сравнение в том случае, когда число групп более двух.

    Ниже представлены аналогичные результаты по массиву G.J.H., когда оценивались уравнения логистической регрессии при сравнении трёх групп. При этом было получено 26 уравнений. По одному из этих уравнений значение Percent Concordant было равно 98,1%, а значение Somers' D было равно 0,943. В следующей таблице представлены средние значения параметра BETA, и средние вероятности отнесения наблюдений в сравниваемые группы.
(N.B.! Выражение типа 8,56E-9 означает 8,56 *10-9    )

   Ниже в таблице сопряжённости представлены по трём сравниваемым группам частоты фактические и предсказанные. Видно, что наибольшая доля правильно предсказанных по уравнению логистической регрессии, характерна для наблюдений группы «А=2». Тогда как, соответственно, минимальная доля характерна для наблюдений группы «А=3».

   Ранее мы уже предлагали сравнивать комбинации значений предикторов для тех наблюдений, которые по уравнению логистической регрессии были переклассифицированы в свою группу. Однако при наличии не двух, а более групп, подобное сравнение этих наблюдений уже значительно сложнее. Детали подобных сравнений мы обсудим в 10-й статье по логистической регрессии, в которой будут приведены примеры использования этого метода в стоматологических исследованиях.

     Итак, процедуры сравнения отдельных параметров получаемых с помощью метода логистической регрессии, более сложны, но при этом более продуктивны, нежели простые сравнения групповых средних.


Далее: Заключение. Список литературы

Примеры оформления заказчиками базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1  Пример 2  
Пример 3


  НЦ БИОСТАТИСТИКА
выполняет статистический анализ данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Нашими услугами пользуются аспиранты и докторанты по медицине, биологии, социологии, психологии и т.д. (См. далее )

Отзывы исследователей по статистическому анализу данных


Интересная ссылка


ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК № 5, 1997 г. В.П.Леонов, П.В.Ижевский.

Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками.


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

Роль «малых» доз ионизирующего излучения в развитии неонкологических эффектов: гипотеза или реальность? Бюллетень сибирской медицины, № 2, 2005, с. 63-70. Карпов А.Б., Семенова Ю.В., , Тахауов Р.М., Литвиненко Т.М., Попов С.В., Леонов В.П.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Логистическая регрессия в медицине и биологии.
Леонов В.

В серии 10 статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

Введение.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии.


Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.

В. Леонов. КЛАССИФИКАЦИЯ ОШИБОК ПРИМЕНЕНИЯ СТАТИСТИКИ В ОТЕЧЕСТВЕННОЙ МЕДИЦИНЕ.


В. Леонов. МЕМЕТИЧЕСКИЙ АНАЛИЗ СТАТИСТИЧЕСКИХ ЗАБЛУЖДЕНИЙ В ПУБЛИКАЦИЯХ НАУЧНЫХ ШКОЛ

Леонов В.П. Введение в семиотику информационных технологий: учебное пособие. – Томск: Изд-во НТЛ, 2011. – 248 с. Учебное пособие является первой книгой из серии учебных пособий по современным проблемам информатики, подготавливаемых на факультете информатики ТГУ. Книга предназначена для студентов как естественных, так и гуманитарных факультетов, изучающих информатику. Изложены основные понятия семиотики как одной из составляющих частей информатики. Рассмотрены классификации знаков и их свойств, в частности мобильность и ареальность, а также изменение природы носителей информации. 5-я глава - "Статистическая структура информационных массивов".

Леонов В.П. Обработка экспериментальных данных на программируемых микрокалькуляторах.

Леонов В.П. Введение в физику и технологию элементной базы ЭВМ и компьютеров.

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. Почему появилась эта статья? За время существования сайта БИОМЕТРИКА его автору пришло довольно много писем, в которых читатели консультировались относительно различных нюансов использования и описания методов статистики в статьях и диссертациях. Этот поток писем периодически возрастал после публикаций статей автора на сопутствующие темы в "Бюллетене ВАК РФ",  "Международном журнале медицинской практики",  "Медицинской газете",  "Сибирском медицинском журнале", а также непосредственно на сайте БИОМЕТРИКА. С каждым годом таких писем становится все больше...

Леонов В.П. Общие проблемы применения статистики в биомедицине. 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Факторный анализ: основные положения и ошибки применения.

История биометрики

Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ 
ДЛЯ МЕДИКОВ И БИОЛОГОВ. 

(время и опыт)
. Леонов В.

Общие проблемы применения статистики в биомедицине,  или что разумнее: ДДПП или ДППД?

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.
Ошибка – это …
Ошибка или обман?

Обзоры ошибок применения статистики в медицине

Причины возникновения ошибок и меры борьбы с ними

Ошибки описания статистических методов

Меметический анализ описаний методов статистики

Локализация ошибочных описаний внутри научных школ

Мемы камуфляжных описаний

Смутно пишут о том, о чём смутно представляют

Коварный t-критерий Стьюдента

«… не зная законов языка ирокезского, можешь ли ты делать такое суждение  по  сему предмету…»

Что же делать, чтобы избежать ошибок?

КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?

Н.Бейли. МАТЕМАТИКА В БИОЛОГИИ И МЕДИЦИНЕ

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях

В.П. Леонов.  Камуфляжные мемы инфоценоза научных школ // Философия математики: актуальные проблемы. Материалы Международной научной конференции 15-16 июня 2007. Москва, Изд. Саван С. А., 2007. - с. 212-216.

ВОЗМОЖНОСТИ БИОМЕТРИЧЕСКОГО АНАЛИЗА ВЗАИМОСВЯЗИ СОМАТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И СИСТЕМАТИКИ ПСИХИЧЕСКИХ РАССТРОЙСТВ.
Н.П.Гарганеева, В.П.Леонов. Сибирский медицинский журнал, № 2, 2001, с.25-32.

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов.Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах..


В. Леонов. Общие проблемы применения статистики в биомедицине. 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК № 5, 1997 г. В.П.Леонов, П.В.Ижевский.

В. Леонов. Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. 

В. Леонов. Общие проблемы применения статистики в биомедицине.

В.П.Леонов. Применение разведочного анализа для оценки исходных данных (на примере наблюдений по уролитиазу)

Леонов В.П. Классификация ошибок применения статистики в отечественной медицине. Материалы научной конференции "Системный анализ в медицине" (САМ 2007). Благовещенск, 2007, Амурский государственный университет.

Леонов В.П. Стандартизация формы представления экспериментального материала как проблема информационной экологии. Материалы научной конференции "Системный анализ в медицине" (САМ 2007). Благовещенск, 2007, Амурский государственный университет.

Леонов В.П. Сравнительный анализ статистических парадигм отечественных и американских публикаций по медицине и биологии методами наукометрики. Материалы научной конференции "Системный анализ в медицине" (САМ 2007). Благовещенск, 2007, Амурский государственный университет.

Леонов В.П. Камуфляжные мемы инфоценоза научных школ. Материалы Международной научной конференции 15-16 июня 2007  г. "Философия математики: Актуальные проблемы." - Московский государственный университет.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Принципы описания статистики в биомедицинских публикациях. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Основные понятия ROC-анализа. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.


Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕ

ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА.

КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?

ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ.

«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».

КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 

ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.

«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН».

ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.

КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?

ВМЕСТО ЗАКЛЮЧЕНИЯ.

Весь обзор одним файлом


Отзывы читателей обзора Статистика в кардиологии. 15 лет спустя.

В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения.    

В. Леонов. Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.).     Журнал "Кардиология", 1998, № 1 

В. Леонов. Статистика в кардиологии. 15 лет спустя. В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним..

Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Камчатская фото-биометрика-2014. Фоторепортаж с семинара по биометрике в Петропавловске-Камчатском.

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском


Отзывы исследователей по
статистическому анализу
данных


После взрыва на СХК в 1993г. в Томске и Северске увеличилась частота рождения детей с пороками развития

Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.


1997 - 2019.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"