Яндекс.Метрика

Статистические методы анализа в медицине

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят.
 
Пишите нам на адрес

Выбрав любое изображение, кликните по нему мышкой, и Вы прочитаете о том, как ...

Редактор БИОМЕТРИКИ
В. Леонов

Яндекс
цитирования
Яндекс цитирования
 
25 наиболее популярных ссылок, посещаемых нашими читателями
http://www.biometrica.tomsk.ru/Leonov_Erevan_2015.pdf
http://www.biometrica.tomsk.ru/erevan_8.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/UNESCO%202010.pdf
http://www.biometrica.tomsk.ru/zakaz.htm
http://www.biometrica.tomsk.ru/zakaz_28.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/STAT_CARDIO_2014.pdf
http://www.biometrica.tomsk.ru/logit_9.htm
http://www.biometrica.tomsk.ru/stat_cardio7.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/zakaz_19.htm
http://www.biometrica.tomsk.ru/lis.htm
http://www.biometrica.tomsk.ru/kamchat.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/zakaz_15.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

Сравниваем средние, а также и ...

В. Леонов

Читай не затем, чтобы противоречить и опровергать;
не затем, чтобы принимать на веру;
и не затем, чтобы найти предмет для беседы;
но чтобы мыслить и рассуждать.
____________
Фрэнсис Бэкон

 

 

Что сравнивать в корреляции и регрессии?

 

Метод - самая первая, основная вещь…
От метода, от способа действия зависит
вся серьёзность исследования.
Все дело в хорошем методе…
Метод держит в руках судьбу исследования.
_______________________________

Иван Петрович Павлов

 

Особенности распределения наблюдений, описываемых парой количественных признаков, также может описываться разными параметрами. Наиболее часто вначале используется оценка коэффициентов корреляции.  Для пары количественных признаков эти разные показатели интенсивности взаимосвязи имеют модули своих значений от 0 до 1. Как и для предыдущей пары признаков, значение равное 0 означает отсутствие взаимосвязи. А значение равное 1 означает наличие функциональной взаимосвязи. Для выбора вида используемого коэффициента корреляции, необходимо вначале с помощью двумерного графика отобразить структуру этой потенциальной связи. Поскольку помимо линейной связи, для оценки интенсивности которой используется коэффициент корреляции Пирсона, анализируемая связь может быть и сугубо нелинейной. Ниже приведены 3 графика, отражающие такие особенности. На первом графике приведена типичная линейная взаимосвязь между парой признаков.  

 

 

 

 

А на двух следующих графиках показано, что если использовать коэффициент линейной корреляции, без проверки типа зависимости между парой признаков с помощью графики, то устанавливается отсутствие связи двух признаков. Однако на графике отчётливо видна  сугубо нелинейная взаимосвязь.

Поэтому при использовании коэффициента корреляции для нелинейной связи между этой парой признаков, фиксируется статистически значимая и весьма интенсивная взаимосвязь.

Аналогичная методика сообщит и об огромном количестве парных взаимосвязей между количественными переменными, которые могут быть исследованными для различных градаций группирующих признаков. В таких ситуациях для выбора анализа подобных взаимосвязей оптимально использование следующего подхода. Вначале составляется список тех взаимосвязей, которые сформулированы априори в виде цели и задачи проводимого исследования. Например, исследовать изменение параметров конкретных количественных признаков (среднее, доверительный интервал для среднего, дисперсия, и т.д.) для пациентов в результате лечения. Естественно, что для этого реально можно (и нужно!) применять разные методы статистического анализа.

А для выбора апостериори анализов взаимосвязей, следует сделать много полезных для выбора графиков. Это графики выражающие связи между количественным и качественным признаком, между парами количественных признаков, а также между парами количественных признаков с учётом одного или более качественных признаков. Использование такого графического этапа полезно с использованием специальных пакетов анализа. И при визуальном обнаружении таких взаимосвязей, далее применять уже различные методы статистического анализа, в том числе и методы сравнения не только средних значений. С учётом описанной выше оценки вариантов комбинаций разных признаков, по упомянутому массиву данных исследователя G.L., было сделано 10 тысяч графиков. При просмотре этих графиков были выбраны те комбинации признаков, на которых достаточно ясно отражалось наличие взаимосвязи между признаками. Ниже приводится несколько графиков для некоторых комбинаций признаков, и обсуждается специфика дальнейшего их анализа.  

   На этом графике приведено распределение наблюдений упомянутого массива данных в осях HB и SP. Видно наличие линейной корреляции между этой парой признаков, для которой статистически значимый коэффициент корреляции Пирсона r = 0,8883. Также приведено в заголовке графика уравнение парной линейной регрессии SP = 49,8492 + 0,4671*HB. На графике приведена красная линия регрессии по данному уравнению.

   Для этой пары признаков было также построено 24 графика с указанием принадлежности наблюдений к конкретным градациям каждого группирующего признака. Ниже приведён один из таких графиков, с использованием группирующего признака GES.

На этом графике видно, что все три группы наблюдений, выделенные разными цветами точек (наблюдений), лишь частично перекрываются друг с другом. Тогда как средние значения признаков HB и SP в этих группах существенно различаются. Ниже в таблице приведены средние значения двух этих признаков.

GES Переменная N Среднее Стандартное отклонение Дисперсия Коэффициент вариации, %
1 SP 234 120,25 4,68 26,90 3,89
1 HB 234 159,01 10,19 103,84 6,41
2 SP 234 132,56 6,00 36,00 4,43
2 HB 234 168,85 8,71 75,86 5,16
3 SP 240 146,50 7,75 60,06 5,29
3 HB 240 207,03 13,93 194,04 6,73

 

Исходя из расположений этих трёх групп, была произведена проверка статистических гипотез
H0: µ1= µ2= µ3 ; H1: µ1µ2µ3 для признаков HB и SP. Естественно, что предварительно для каждой из этих трёх групп была проведена проверка гипотез нормального распределения этих признаков. Оказалось, что в группе GES=1 оба признака не имели нормального распределения. Тогда как в остальных двух группах у одного признака не было нормального распределения. Поэтому для проверки приведённых выше статистических гипотез использовались непараметрические критерии Ван дер Вардена, Краскела-Валлиса, а также медианный критерий. Результаты их применения привели к принятию гипотезы неравенства средних групповых всех трёх групп: H1: µ1µ2µ3. После чего были проведены также проверки равенства центральных параметров для пар групп: 1-2; 1-3; 2-3. И для всех этих трёх парных групп нулевые гипотезы также были отклонены. А с помощью критериев Сиджела-Тьюки и Ансари-Брэдли  также были отклонены гипотезы равенства трёх групповых дисперсий. На выбранных графиках, количеством порядка 1 тысячи, ясно отражалось наличие взаимосвязи между признаками. И по ним также были проведены аналогичные анализы.

Поскольку в каждой из трёх этих групп видно наличие линейной корреляции между признаками HB и SP, то целесообразно выполнить раздельно по каждой из трёх групп корреляционный и регрессионный анализ. Ниже приведены 4 графика как с общим расположением трёх групп, так и с раздельным их расположением. Также в этих графиках изменяются признаки в горизонтальных осях X и вертикальных осях Y. Это делается для демонстрации идентичности при этом коэффициентов корреляции rxy и ryx, и различия между уравнением SP = b0 + b1* HB и уравнением HB = c0 + c1* SP.


Если сравнить полученные для каждой из трёх групп результаты корреляционного анализа, то видно, что имеются некоторые существенные различия. Так для группы GES=1 коэффициент корреляции Пирсона r1=0,7818. И для группы GES=2 этот коэффициент корреляции почти такой же: r2=0,7700.
Тогда как для группы GES=3 коэффициент корреляции существенно меньше: r3=0,5816.

Итак, сравнение этих коэффициентов корреляции показало, что максимальные коэффициенты линейной корреляции в 1-й и 2-й группах, а минимальная корреляция в 3-й группе. Поэтому целесообразно произвести сравнение этих коэффициентов корреляции. То есть произвести проверку следующих статистических гипотез о равенстве коэффициентов корреляции групп 1-3 и 2-3:
H0: ρ1= ρ3 ;   H1: ρ1 ≠ ρ3 ;
H0: ρ2= ρ3 ;   H1: ρ2 ≠ ρ3 ;

Весьма подробное описание проверки подобных гипотез приведено в [82] на страницах 197-199.
Данная проверка показала, что коэффициенты корреляции между группами 1-3 и 2-3 отличаются статистически значимо (р < 0,0001). Тогда как между группами 1-2 эти коэффициенты не различаются статистически значимо. То есть в группах GES=1 и GES=2 имеется более сильная взаимосвязь между признаками HB и SP, нежели в группе GES=3.

Внимательное изучение уравнений парной регрессии для этих трёх групп, показывает, что в этих уравнениях не идентичны как свободные члены уравнений α, так и регрессионные коэффициенты β . На графиках с горизонтальной осью HB и вертикальной осью SP, представлены три следующих уравнения:
GES: 1 SP = 63,2956 + 0,3588 * HB
GES: 2 SP = 42,9818 + 0,5305 * HB
GES: 3 SP = 79,5093 + 0,3236 * HB

Причём на том графике, где представлены все три группы GES, отчётливо видно, что выделенная красным цветом линия регрессии для группы GES=2, имеет угол наклона самый большой из этих трёх групп. Соответственно и коэффициент регрессии у этого уравнения, равный 0,5305 , больше чем соответствующие коэффициенты в группах GES=1 и GES=3. То есть в группе GES=2, при увеличении признака HB на 10 единиц, наиболее вероятное изменение признака SP равно 5,305. Тогда как в группе GES=1 такое изменение составит 3,588 , а в группе GES=3 это изменение составит 3,236. Поэтому целесообразно произвести сравнение этих коэффициентов регрессии. То есть сделать проверку следующих статистических гипотез о равенстве коэффициентов регрессии групп 1-2 и 3-2:

H0: β1= β2 ;   H1: β1 ≠ β2 ;

H0: β3= β2 ;   H1: β3 ≠ β2 ;


Описание проверки подобных гипотез приведено в [82] на страницах 206-212.
Данная проверка показала, что коэффициенты регрессии между группами 1-2 и 3-2 отличаются статистически значимо (р < 0,0001). Тогда как между группами 1-3 эти коэффициенты не различаются статистически значимо. То есть в группах GES=1 и GES=2 имеется более сильная взаимосвязь между признаками HB и SP, нежели в группе GES=3.

Различие регрессионных коэффициентов в сравниваемых группах весьма важно. В том случае, когда значения зависимой переменной Y являются результатами изменений причинной переменной (предиктора) X, то коэффициент регрессии сказывается на величине дисперсии зависимой переменной Y. Например, в двух группах получены два следующих регрессионных уравнения: Y1 = a1 + b1*X , и Y2 = a2 + b2 *X.

Если два регрессионных коэффициента статистически значимо различаются, и b1 > b2 , то линия регрессии в первом уравнении будет иметь больший угол, нежели во втором уравнении с меньшим значением регрессионного коэффициента. Поэтому при одном и том же интервале изменений предиктора X, интервал значений зависимой переменной Y в первом уравнении будет существенно больше, и, соответственно, дисперсии зависимой переменной Y в двух сравниваемых группах будут весьма существенно отличаться. Поэтому неравенство дисперсий в сравниваемых группах, может быть результатом разных причин, в том числе и результатом различия регрессионных коэффициентов. Ниже приведён график с уравнениями линейной регрессии для двух групп по упомянутому массиву данных исследователя G.L.

По графику видим, что в обеих группах признак SP имеет равные интервалы изменения. Тогда как интервалы изменения и дисперсии признака AMD, отличаются в этих двух группах весьма существенно. Поскольку в первой группе коэффициент регрессии равен 2,1107, а во второй группе аналогичный коэффициент равен 0,9287. При этом коэффициенты корреляции отличаются немного, и гипотеза о равенстве этих корреляционных коэффициентов не отвергается.


Ниже в двух таблицах представлены дескриптивные статистики обоих признаков в двух сравниваемых группах.

 

    С помощью критерия Шапиро-Уилка подтверждена нормальность распределения обоих признаков в двух группах сравнения. Поэтому для признака AMD используем F-критерий Фишера-Снедекора, равный отношению двух дисперсий: F=553,2455 / 126,1906 = 4,384. По таблице F-распределения находим уровень статистической значимости для F=4,384; p < 0,0001. То есть принимается гипотеза неравенства дисперсий данного признака в двух сравниваемых группах. Следовательно, неравенство коэффициентов регрессии приводит и к неравенству дисперсий.

   Существенное различие интервалов и дисперсий изменения признаков может объясняться не только различием регрессионных коэффициентов, но и видами регрессионных зависимостей. Например, в одной группе это линейная зависимость, а в другой группе сравнения та же парная зависимость оказывается сугубо нелинейной. Например, регрессия описывается уравнением 2-й или 3-й степени, либо экспоненциальной зависимостью, и т.п.

    Важность сравнения дисперсий актуальна не только при сравнении разных групп, но и при использовании многих иных методов статистического анализа. Так популярной задачей исследований является оценка множественного уравнения регрессии. В этом случае может использоваться большое количество различных регрессионных моделей. Например, множественные линейные уравнения регрессии, множественные нелинейные уравнения регрессии, уравнения типа производственной функции Кобба-Дугласа, и т.д.

    Из получаемого набора регрессионных уравнений для достижения поставленных целей, выбирают одно или несколько наиболее ценных и полезных уравнений. Мотивация такого выбора содержит, как правило, несколько деталей. Это и составы вошедших в уравнения признаков-предикторов, возможности целенаправленных изменений этих предикторов, значения стандартизованных коэффициентов предикторов, и т.д. Но при этом важнейшим показателем адекватности полученной зависимости является минимизация дисперсии значений ошибок  ei = Yi – Ÿi . Где Yi   – фактическое значение зависимой переменной для i-того наблюдения, а Ÿi– значение, предсказанное по конкретному уравнению. То есть выбор тех уравнений регрессии, в которых предсказанные значения наиболее близки к фактическим значениям зависимой переменной.

  Получая наборы подобных ошибок  ei , несложно вычислить их дисперсию по каждому из сравниваемых уравнений. Ну а далее следует производить проверку статистических гипотез о равенстве этих дисперсий, выбрав в конечном итоге то уравнение, в котором дисперсия ошибок самая маленькая. Разумеется, при реализации этих методов оценки уравнений можно использовать и метод генерации пробных подвыборок, по которым оцениваются уравнения, и производить их проверку на оставшихся частях выборок. Напомню, что в этой акции опять же первоначально следует проверять распределение получаемых ошибок на нормальный закон. И на основе полученного результата выбирать соответствующие статистические критерии для проверки гипотез о равенстве дисперсий.

    Поскольку в этих случаях возможно наличие одного или нескольких аномальных значений зависимой переменной, т.е. наблюдений с «выбросами»,  то для каждого уравнения регрессии при проверке нормальности распределения ошибок, также следует использовать для наблюдений оценки дистанции Mahalanobis и Cook's.  Сравнивая эти дистанции отдельных наблюдений, можно установить имеющиеся аномальные наблюдения, и произвести повторные оценки уравнений регрессии без этих наблюдений. И последующие сравнения будут произведены как для дисперсий ошибок сравниваемых уравнений, так и для коэффициентов уравнений, и множественных коэффициентов корреляции.

   Достаточно подробно аспекты выбора наилучших вариантов уравнений регрессии описаны в монографиях [23, 82]. Основное содержание данной статьи посвящено особенностям сравнения разных параметров одного или двух количественных признаков. Однако в реальных исследованиях число анализируемых количественных признаков всегда более одного. То есть анализируются от двух и более количественных признаков. При этом, кроме количественных признаков всегда используются и группирующие качественные признаки. В начале данной статьи мы уже обращали внимание на то, что в статьях, диссертациях и монографиях по медицине и биологии, доминируют сравнения групповых средних. В том числе не только с помощью t-критерия Стьюдента, но и параметрического и непараметрического дисперсионного анализа.

     Поскольку число количественных признаков в этих сравниваемых группах более одного, то логично использовать и многомерные сравнения. Например, сравнение векторов, координаты которых оцениваются для каждой из групп сравнения. Данный метод называется многомерным дисперсионным анализом (Multivariate Analysis of Variance – MANOVA). Весьма подробно эта технология описана в книге [4]. Этот метод MANOVA не следует путать с многофакторным дисперсионным анализом ANOVA, в котором производится сравнение групповых средних одной количественной переменной, но с учётом наличия более одного группирующего признака (фактора). С примерами использования различных методов статистического анализа, можно познакомиться в подборке публикаций, список которых приведён по этому адресу. 

    В подобных ситуациях важно не только сравнивать групповые вектора, но также и все наблюдения этих групп. Каждое из этих наблюдений описывается набором значений количественных и качественных признаков. При сравнении групп, в которых наблюдения описываются только количественными признаками, весьма продуктивно применяется метод дискриминантного анализа. Причём у данного метода достаточно большое количество вариантов реализации. Поэтому для получения оптимального результата следует использовать гораздо больше одного из этих вариантов. Продуктивное сравнение многомерных групп, наблюдения которых описываются как количественными, так и качественными признаками, производится с помощью метода логистической регрессии. Отличные примеры использования дискриминантного анализа и логистической регрессии приведены в диссертациях, представленных на первой странице нашего сайта БИОМЕТРИКА. А описание метода логистической регрессии приведено в 9 наших статьях, список которых приведён на первой странице сайта БИОМЕТРИКА. Следующая, 10-я статья этой серии, будет содержать описание других специфик использования этого метода, с примерами в стоматологических исследованиях.

    Подобно сравнению уравнений множественной регрессии, необходимо продуктивно сравнивать и результаты, получаемые в методе логистической регрессии. Как и во всех прочих многомерных методах, в данном методе также используются разные алгоритмы оценки уравнений. Основные отличия этих алгоритмов отражаются в структуре оцениваемых уравнений, в методах отбора признаков-предикторов, в особенностях представления группирующих признаков при отборе признаков-предикторов, в значениях критических уровней статистической значимости, задаваемых при пошаговых процедурах отбора предикторов, и т.д. Выше мы уже обсуждали, что показателем адекватности уравнения множественной регрессии, является минимизация дисперсии разностей между фактическим и предсказанным значением  ei = Yi – Ÿi.

   Однако в отличии от стандартной множественной регрессии, в логистической регрессии производится сравнение двух и более групп наблюдений. То есть, используя полученное уравнение логистической регрессии, вычисляются вероятности отнесения каждого конкретного наблюдения к каждой из сравниваемых групп. И в этом случае оценку адекватности получаемых уравнений логистической регрессии подобным методом минимизации дисперсий ошибок производить не реально. Во-первых, поскольку с использованием разных алгоритмов также получаются наборы разных уравнений логистической регрессии. Однако при этом разные уравнения могут предсказывать вероятности отнесения конкретных наблюдений не ко всем к сравниваемым группам. То есть получить аналогичные разности вероятности фактической, и вероятности прогнозируемой по уравнению логистической регрессии, возможно не для всех групп сравнения. Поскольку это связано также и с назначением критического уровня вероятности отнесения анализируемых наблюдений к конкретной группе сравнения. Аналогичный аспект имеется и в другом подобном многомерном методе сравнения групп – в дискриминантном анализе.

   Ниже приведены фрагменты двух примеров использования метода логистической регрессии [52], по которым обсуждаются возможные сравнения полученных групповых параметров. При сравнении двух групп наблюдений по массиву G.J.H., с помощью метода логистической регрессии, было получено 30 уравнений. По одному из этих уравнений значение Percent Concordant  было равно 97,8%,  а значение Somers' D  было равно 0,937. Ниже в таблице представлены средние значения параметра BETA, и средние вероятности отнесения наблюдений в сравниваемые группы, полученные в данном уравнении.

Сравнение средних значений параметров (последний столбец таблицы) показывает, что максимальное значение модуля параметра BETA в группе 1, равное 8,6905034. И средняя вероятность отнесения анализируемых 272 наблюдений в свою группу 1, также высока, и равна 0,9480942. Тогда как аналогичные средние значения по группе 2 существенно меньше.

Далее в таблице сопряжённости представлены по обеим сравниваемым группам частоты наблюдений (пациентов) фактические и предсказанные. Видно, что наибольшая доля правильно предсказанной, по уравнению логистической регрессии, принадлежности наблюдений к конкретной группе, характерна для наблюдений группы «А=1». В частности, полученное уравнение логистической регрессии из 272 наблюдений группы «А=1» отнесло в эту же самую группу 266 наблюдений. И лишь 6 наблюдений было отнесено в группу «А=2». Тогда как, соответственно, минимальная доля классификации наблюдений в свою же собственную группу, характерна для наблюдений группы «А=2».

И для данной таблицы сопряжённости значение V-Крамера равно 0,7504.

    В серии статей о логистической регрессии [52], показано, что помимо уравнений в результатах анализа можно получать для каждого наблюдения сравниваемых групп конкретные значения параметра BETA и вероятности отнесения каждого наблюдения в любую из сравниваемых групп. И в этом случае продолжением сравнения групп может стать сравнение комбинаций значений предикторов, вошедших в уравнение, для наблюдений, относимых по уравнению, как в свою собственную группу, так и в другую группу. Благодаря этому сравнению можно установить, за счёт значений каких наиболее важных предикторов конкретное наблюдение переклассифицировано не свою группу, а в другую. При этом отметим, что более простая технология такого сравнения для случая двух анализируемых групп. И более сложное сравнение в том случае, когда число групп более двух.

    Ниже представлены аналогичные результаты по массиву G.J.H., когда оценивались уравнения логистической регрессии при сравнении трёх групп. При этом было получено 26 уравнений. По одному из этих уравнений значение Percent Concordant было равно 98,1%, а значение Somers' D было равно 0,943. В следующей таблице представлены средние значения параметра BETA, и средние вероятности отнесения наблюдений в сравниваемые группы.
(N.B.! Выражение типа 8,56E-9 означает 8,56 *10-9    )

   Ниже в таблице сопряжённости представлены по трём сравниваемым группам частоты фактические и предсказанные. Видно, что наибольшая доля правильно предсказанных по уравнению логистической регрессии, характерна для наблюдений группы «А=2». Тогда как, соответственно, минимальная доля характерна для наблюдений группы «А=3».

   Ранее мы уже предлагали сравнивать комбинации значений предикторов для тех наблюдений, которые по уравнению логистической регрессии были переклассифицированы в свою группу. Однако при наличии не двух, а более групп, подобное сравнение этих наблюдений уже значительно сложнее. Детали подобных сравнений мы обсудим в 10-й статье по логистической регрессии, в которой будут приведены примеры использования этого метода в стоматологических исследованиях.

     Итак, процедуры сравнения отдельных параметров получаемых с помощью метода логистической регрессии, более сложны, но при этом более продуктивны, нежели простые сравнения групповых средних.


Далее:

Заключение. Список литературы

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Отзывы заказчиков по статистическому анализу данных

«Роющая деятельность кабана». Статья в "Независимой" газете...

Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

23 примера оформления данных, их описания и описания целей исследования.

Сравниваем средние, а также и ... В. Леонов

Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева
ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко
  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская
"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с. Актуальность этого издания весьма велика. По-прежнему в биомедицинских статьях и диссертациях публикуется масса статистических нелепостей, как образцы "статистического самоудовлетворения" и "статистического макияжа". Например, в двух диссертациях, выполненных в 2014 и 2015 гг. в Алтайском медуниверситете по разным специальностям, но при этом в полностью идентичных описаниях, состоящих из 94 слов, написано следующее. «Полученные данные были статистически обработаны с использованием программ Microsoft Offis Exel 2007. Достоверность различий между средними величинами определяли с помощью критерия значимости Стьюдента (t). Нормальность распределений в группах оценивали по критерию Шапиро-Уилка». Далее сообщается об использовании критерия Манна-Уитни, и т.д. Очевидно, что под Offis Exel авторы подразумевали Office Excel. Сложнее было бы об этом догадаться, если бы авторы написали Offis Exul. Вывод: оба диссертанта, как и члены двух диссертационных советов, не знают многого, в том числе описанного в этой книге. Например, не знают того, что в пакете Office Excel нет критериев Шапиро-Уилка и Манна-Уитни. Данная книга обучит правильно и хорошо описывать и понимать результаты статистического анализа. Поэтому исследователи станут более качественно выполнять статистический анализ, получая правильную технологию лечения пациентов. Что в результате будет снижать смертность населения, а также себестоимость лечебных процедур.

  Приложение к русскому изданию книги «Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов».
Авторы: Т. А. Ланг, М. Сесик. Перевод с англ. под ред. Леонова В.П. Изд-во:
Практическая Медицина, 2016.
  В приложении приведён список 209 полезных изданий по использованию статистики в биомедицине.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с. Предыдущие издания оригинала этой книги были опубликованы в 2000, 2005 и 2009 гг. Третье издание книги, как и два предыдущих, имеет целью донести до читателя основные понятия и принципы медицинской статистики, которые достаточно широко используются зарубежными медиками и биологами. Книга содержит необходимую теоретическую часть, а также в доступной форме даёт практическое описание того, как могут применяться статистические методы в реальных клинических исследованиях. Низкий уровень использования статистики в отечественной медицинской науке является одной из основных причин, по которым уже 111 лет Нобелевские премии по медицине не присуждаются россиянам. Ценность этой книги для медицинской науки определяется и проводимой в России реформой отечественной науки, в том числе реформой ВАК и системы научной аттестации. Учебное пособие предназначено для студентов, аспирантов и докторантов медицинских вузов, биологических факультетов университетов, врачей, исследователей-клиницистов и всех, кто является сторонником доказательной медицины.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.
Издание представляет собой вводный курс по принципам статистики. Представлены базовые понятия и принципы статистических исследований применительно к медицине. В отличие от большинства подобных изданий, указанные темы изложены кратко и доступно. Для чтения книги не требуется знание сложных разделов высшей математики, вполне достаточно тех, что даются в школе. Внедрение в практику принципов доказательной медицины диктует необходимость понимания статистики. После знакомства с книгой читатель сможет критически оценивать многочисленные публикации, содержащие статистическую терминологию и результаты описанных исследований. Полученные знания помогут избежать ошибок в планировании биомедицинских исследований, а также в изложении их результатов. Большим преимуществом книги служат глоссарий и подробный предметный указатель.
Для студентов, аспирантов, научных работников, а также врачей всех специальностей.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.
Данная книга является наиболее популярным в мире руководством по доказательной медицине, ставшее известным и в России. Руководство предназначено для студентов и врачей. За 18 лет с момента первого издания в 1996 г., эта книга переведена на восемь языков (испанский, итальянский, китайский, немецкий, русский, французский, чешский, японский) и напечатана огромными тиражами. Руководство завоевало признание практикующих врачей, преподавателей и студентов во многих странах; по нему преподается медицина, основанная на доказательствах, в медицинских школах всего мира. В книге 17 глав, среди которых есть и глава "Статистика для неспециалиста". Эта главу мы дополнили большим списком русскоязычной литературы как по самой статистике, так и по биостатистике. А начинается книга с определения понятия "доказательная медицина". Итак, что же такое "доказательная медицина"? Что, чем, и зачем "доказывают"? Читайте эту книгу!


Логистическая регрессия в медицине и биологии. Леонов В.

В серии из 9 статей рассмотрены основы метода логистической регрессии. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии


Долгое прощание с лысенковщиной

Семинары по биометрике


КУНСТКАМЕРА. Обзор большой коллекции медицинских статей и диссертаций с существенными ошибками и нелепыми использованиями и описаниями методов статистики.

Экспозиция 1  Экспозиция 2  Экспозиция 3  Экспозиция 4  Экспозиция 5 Экспозиция 6  Экспозиция 7  Экспозиция 8   Экспозиция 9

Для удобства работы с экспонатами они отсортированы по фамилиям авторов, городам, в которых проживают авторы, и по организациям, в которых работают авторы, а также по научным специальностям

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Сравнительная характеристика показателей кардиореспираторной системы спортсменов и лиц, не занимающихся спортом, в условиях северного промышленного города", Тюменский государственный университет, Тюмень - 2006 г.

Новый экспонат КУНСTКАМЕРЫ - Диссертация «Анализ полиморфизма генов сердечно-сосудистой системы и системы детоксикации в различных возрастных группах Санкт-Петербурга». Обсуждаемая диссертация являет собой ярчайший пример того, какую злую шутку может сыграть с автором игнорирование проблемы множественных сравнений при статистическом анализе полученных данных.

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Оценка проаритмических факторов при постинфарктной систолической дисфункции миокарда и эффективности их фармакологической коррекции", Кемеровская государственная медицинская академия, Кемерово - 2004 г.


Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения. Вот как пишет об этом известный специалист в области прикладной статистики профессор А.И. Орлов в своей книге ЭКОНОМЕТРИКА (Издательство ЭКЗАМЕН, Москва, 2004. - 576 с.). "Приведённые описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений  соответствующих случайных величин. Очевидно, для оправдания или обоснованного изменения существующей практики анализа статистических данных требуется изучить свойства процедур анализа данных при «незаконном» применении. Изучение процедур отбраковки показало, что они крайне неустойчивы к отклонениям от нормальности, а потому применять их для обработки реальных данных нецелесообразно; поэтому нельзя утверждать, что произвольно взятая процедура устойчива к отклонениям от нормальности". Именно Александр Иванович в своём письме от 4 апреля 1998 г. и обратил моё внимание на эту проблему.


Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.

Отзывы читателей обзора "Статистика в кардиологии. 15 лет спустя". В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...


ВАК для учёных? или ВАК для… бумагомарак? «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год. За 2 года, прошедших с момента публикации этой статьи, её прочитали более 29 тысяч читателей.  "Плагиат, обнаруживаемый в диссертациях, это «пена» диссертационного бизнеса. Поскольку в производстве диссертаций «под заказ» гораздо легче просто копировать фрагменты одних диссертаций, вставляя их в очередные заказные диссертации. Производители такого «товара» фабрикуют не только диссертации, но и массу журнальных статей. Основные причины появления этого бизнеса описал профессор Е.В. Балацкий ещё в 2005 г. [1-2], изложив и сценарии его ликвидации. Одной из ключевых причин рождения этого бизнеса являются изменения в Положениях ВАК".

Балацкий Е.В. Диссертационная ловушка


Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА.
КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?
ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ
.
«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».
КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 
ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.
«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН». ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.
КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?
ВМЕСТО ЗАКЛЮЧЕНИЯ.
Весь обзор одним файлом


Отзывы читателей обзора Статистика в кардиологии. 15 лет спустя.

В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения.    

Н. Зорин. "Достоверность" или "статистическая значимость" - 12 лет спустя Изложены последствия неправильного употребления термина "достоверность" в российских медицинских публикациях. Даны рекомендации для исследователей и редакторов медицинских изданий по правильному и наиболее оптимальному употреблению упомянутых терминов и языка контекста.

Диссертационные войны. Как борьба с плагиатом в диссертациях переместилась из науки в политику

Балацкий Е.В. Диссертационная ловушка

МАТЕМАТИЧЕСКАЯ МОРФОЛОГИЯ.
ЭЛЕКТРОННЫЙ МАТЕМАТИЧЕСКИЙ И МЕДИКО-БИОЛОГИЧЕСКИЙ ЖУРНАЛ

БИОМЕТРИКЕ - 15 лет! А что было раньше? И что теперь?  Леонов В.П.
15 лет... Возраст немалый... Как появился наш сайт? И стал ли он популярным?
Первоначально наш сайт был разделом на сайте Доктор.Ру, который был создан в Хабаровске. Вот как выглядел этот раздел, например, 20 июля 2001 года. Поскольку в те годы скорость передачи информации в интернете была невысокая, то для облегчения доступа к материалам БИОМЕТРИКИ мы открыли "зеркала" (копии) в таких городах, как Томск, Владивосток, Москва, Киев. В дальнейшем, когда сайт Доктор.Ру переехал в Москву, был сделан отдельный хостинг БИОМЕТРИКИ в Томске. Со временем необходимость наличия "зеркал" сайта в других городах отпала, и БИОМЕТРИКА осталась в Томске. Читатели БИОМЕТРИКИ в своих письмах часто задают вопрос о том, каковы были мотивы создания этого сайта? Чтобы немного рассказать об этом, вернёмся на 27 лет назад, в прошлое.

Статистика в кардиологии. 15 лет спустя. Леонов В.П.

15 лет назад, в 1998 году, в журнале «Кардиология» была опубликована наша статья  «Применение методов статистики в кардиологии (по материалам журнала «Кардиология» за 1993–1995 гг.) В нём были проанализированы 426 статей кардиологической тематики. В новом обзоре проаналированы современные журнальные статьи кардиологической тематики. Учитывая то, что  в настоящее время в России смертность от сердечно-сосудистых заболеваний более чем в 4 раза выше, чем в Европе, США и Японии, актуальной задачей является оценка эффективности использования статистики в российской кардиологии. (Весь обзор одним файлом)

Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.). Леонов В.П. Кардиология, 1998, № 1, с. 55-58.

В НОВЫЙ ВЕК - С ДОКАЗАТЕЛЬНОЙ БИОМЕДИЦИНОЙ

ОТВЕТ  ВАК РФ   АВТОРАМ СТАТЬИ  


1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"