Яндекс.Метрика

Статистические методы анализа в медицине

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят.
 
Пишите нам на адрес

Выбрав любое изображение, кликните по нему мышкой, и Вы прочитаете о том, как ...

Редактор БИОМЕТРИКИ
В. Леонов

Яндекс
цитирования
Яндекс цитирования
 
25 наиболее популярных ссылок, посещаемых нашими читателями
http://www.biometrica.tomsk.ru/comp_aver.htm
http://www.biometrica.tomsk.ru/erevan_8.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/UNESCO%202010.pdf
http://www.biometrica.tomsk.ru/zakaz.htm
http://www.biometrica.tomsk.ru/zakaz_28.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/STAT_CARDIO_2014.pdf
http://www.biometrica.tomsk.ru/logit_9.htm
http://www.biometrica.tomsk.ru/stat_cardio7.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/percent_00.htm
http://www.biometrica.tomsk.ru/lis.htm
http://www.biometrica.tomsk.ru/kamchat.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/zakaz_15.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

Сравниваем средние, а также и ...

В. Леонов

Читай не затем, чтобы противоречить и опровергать;
не затем, чтобы принимать на веру;
и не затем, чтобы найти предмет для беседы;
но чтобы мыслить и рассуждать.
____________
Фрэнсис Бэкон

 

 

Сравниваем средние, дисперсии,  и т.д.

 

Наука есть не что иное,
как отображение действительности.
____________
Фрэнсис Бэкон

 

  Сравнение групповых средних, является  одним из наиболее часто используемых методов проверки взаимосвязи между количественным и качественным признаком. То есть проверка статистической гипотезы о равенстве групповых средних. Когда с помощью конкретного статистического критерия отвергается гипотеза равенства групповых средних, то это как раз и означает наличие взаимосвязи между конкретным количественным признаком, и конкретным качественным, группирующим признаком. Напомним, что для таких зависимостей имеется показатель интенсивности связи, так называемый коэффициент детерминации η², обозначаемый в иных публикациях как R² (см. например, статью "Коэффициент детерминации" в Википедии).

 

Величина этого показателя есть доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью. Формула коэффициента детерминации  приведена на стр. 121 в нашей книге  [37], изданной в 1990 г. Как и коэффициенты корреляции, этот показатель имеет значения от 0 до 1. Однако при количестве сравниваемых групп более 2-х, следует установить, между какими конкретными группами имеется различие средних, а между каким группами они не различаются. Например, при наличии трёх сравниваемых групп следует произвести сравнение средних для пар 1 – 2; 1 – 3, и 2 – 3. Поскольку вполне вероятно, что между некоторыми парами групп таких различий не будет, а между остальными парами групп различия будут. Весьма продуктивно такие результаты  отображать ещё и графически. И в зависимости от результатов проверки этих парных гипотез, имеет смысл проверки и иных парных гипотез. Например, таких  пар: 1– (2+3), (1+2) – 3, (1+3) – 2. Здесь (2+3) означает объединение групп 2 и 3 в одну общую группу, и т.п. И такое объединение разумно производить после принятия гипотезы о равенстве групповых средних в двух этих группах. И т.д. Вернёмся к массиву исследователя G.L., в котором  32 количественных и 24 качественных признаков были представлены в 708 наблюдениях. Ниже на рисунке представлена гистограмма распределения значений количественного признака SP, полученная по 708 наблюдениям:

 

Кривая красного цвета изображает теоретическую нормальную функцию плотности распределения вероятности, с использованием вычисленных параметров распределения (среднее и дисперсия). Как видим, эта кривая весьма значительно отличается от фактического распределения значений этого признака. Проверка гипотезы нормальности распределения значений этого признака, с помощью критериев Шапиро-Уилка, Колмогорова-Смирнова с правкой Лиллиефорса, Крамера-фон-Мизеса и Андерсона-Дарлинга, отвергла нормальность распределения. Особенностью этого распределения можно также отметить и наличие двух значений моды (мода – наиболее часто встречающаяся величина признака). Видим, что первая мода находится в интервале 120-125, а вторая мода в интервале 140-145.

В таблице приведены оценки основных дескриптивных статистик признака SP.
N Mean Std.Dev. Coef.Var. Variance Std.Err. Range Median Max Min
708 129,95 12,58 9,68 158,28 0,47 60 127 166 106

 

    Выше мы уже говорили о том, что наличие не нормального распределения, в частности распределения асимметричного, свидетельствует о наличии неких зависимостей этого количественного признака от одного или нескольких других признаков. Причём эти другие признаки могут быть как дискретными, группирующими признаками, так и количественными признаками. Поскольку упомянутый набор данных содержал 32 количественных признака, и 24 качественных признаков, то, следовательно, для этого признака SP необходимо было провести оценку связей с 31 количественным и 24 качественными признаками. Что и было сделано, установив в результате наличие статистически значимых взаимозависимостей признака SP с 19 количественными признаками, и с 17 качественными признаками. Более того, при оценке взаимосвязей признака SP с остальными 31 количественными признаками, проводимой не по всему массиву в целом, а раздельно по подгруппам в каждом из 24 качественных признаков, было обнаружено наличие 79 статистически значимых взаимосвязей в 17 группах наблюдений. Все эти парные взаимосвязи были упорядочены по уменьшению интенсивности показателей связи. Наибольший интерес в этих парных взаимосвязях представляли группирующие признаки TIME и  PAT. Каждый из этих признаков содержал две подгруппы.

   Таким образом, если проводить оценку парных взаимосвязей не только по всему массиву данных, а раздельно в подгруппах, обусловленных отдельными градациями группирующих признаков, то общее количество возможных взаимосвязей многократно возрастает. И в этой ситуации вновь естественно возникает вопрос о целесообразности и необходимости выполнения такого большого объёма работы по проверке наличия/отсутствия таких связей. Для объяснения подобного возрастания объёма работы, покажем, как увеличится количество потенциальных парных взаимосвязей в данном массиве наблюдений. Выше мы уже показали, что количество парных взаимосвязей между количественными признаками равно 496. Поэтому для 57 градаций в упомянутых 24 качественных признаков, можно провести 496*57=28272  оценки этих парных взаимосвязей. То есть количество оцениваемых парных взаимосвязей увеличивается в 57 раз!

   Подобный многократный рост количества парных связей будет и для  комбинаций между парами качественных признаков, и для комбинаций одного количественного и одного качественного признака.  При принятии решения о целесообразности и необходимости выполнения подобных детальных исследований, следует помнить и о том, что при этом объём работы увеличивается на порядки не только для проведения самого анализа, но и для просмотра и оценки будущих результатов. Причём объём работы реализации первого этапа – выполнение самого анализа, может быть несколько уменьшен написанием аналитических программ с использованием внутренних языков используемых статистических пакетов. Что, естественно, доступно лишь профессиональным статистикам. Тогда как объём второй части – просмотр, оценка и интерпретация результатов усилиями самого специалиста в медицинской и биологической науке,  вообще не может быть уменьшен. Однако и в работе с оценкой и интерпретацией такого огромного объёма результатов есть свои положительные детали. В частности, с помощью профессионального статистика, пишущего программы анализа на специальном языке программирования, могут быть уменьшены объёмы  просматриваемых результатов, либо с его помощью конкретизировано, какие именно детали результатов следует исследователю-заказчику просматривать в первую очередь.

   Таким образом, принятие решения о первом этапе статистического анализа требует весьма аргументированного выбора вариантов анализа, что возможно только в результате сотрудничества двух специалистов – исследователя-медика или биолога, и профессионального биостатистика. В результате такого диалога и будет принято оптимальное решение о выборе раздельного анализа в подгруппах, которые являются основными, доминирующими в проводимом исследовании. Например, в подгруппах «Больной» и «Здоровый», или в подгруппах «До лечения» и «После лечения», или в подгруппах «Не летальный исход»  и «Летальный исход», и т.п. Именно такую практику планирования объёмов статистического анализа мы с коллегами используем уже более 30 лет. Вначале разрабатывая первую версию Программы работ по анализу данных исследователя (Заказчика). Она создаётся на основе результатов пробных анализов, соответствующих целям и задачам исследования, сформулированных исследователем-заказчиком. Далее эта первая версия 1-2 раза обсуждается с исследователем, и в результате принимается окончательная версия.

    Важнейшей особенностью таких диалогов является доступное объяснение исследователю потенциальных возможностей предлагаемых методов статистического анализа. Подобные объяснения специфики предлагаемых БЛОКОВ Программы работ, вводятся в текст Программы в начале каждого отдельного БЛОКА.  В результате таких диалогов примерно 50% исследователей соглашаются с предлагаемой версией Программы работ. 25% исследователей немного сокращают объём Программы, а последние 25% исследователей напротив, увеличивают этот объём, дополняя её новыми пунктами или БЛОКАМИ.

   Достаточно полезно при выборе этих вариантов анализа использовать возможности графических отображений распределения значений признаков.  Поскольку одним из основных группирующих признаков в упомянутом выше массиве данных был признак TIME, то целесообразно было рассмотреть гистограммы раздельно по двум подгруппам этого признака. Ниже представлены гистограммы распределения значений упомянутого признака SP для подгрупп TIME=1 и TIME=2. Кривые красного цвета изображают теоретические нормальные функции плотности распределения вероятности, с использованием параметров, полученных по выборкам.

 

     Глядя на эти рисунки, не сложно отметить, что эти две группы наблюдений отличаются не только средними значениями, но также существенно различаются и интервалами этих значений. То есть максимальными и минимальными значениями. Поэтому они сильно отличаются и значениями размахов (интервала, диапазона) – Range, равных разностям SPmax – SPmin . Если сравнить две эти гистограммы, то видно, что для группы TIME=1 вершина распределения не очень «острая». И такие распределения принято называть плосковершинными. Причём самая максимальная частота отдельного центрального интервала равна 79 наблюдениям (пациентам). И при этом интервал значений этого признака от 116 до 166, с разностью между максимальным  и минимальным значением равной  166-116=50.Тогда как для группы TIME=2 вершина распределения очень «острая». И такие распределения принято называть островершинными. А самая максимальная частота отдельного центрального интервала равна 136, при интервале значений этого признака от 106 до 127. А разность между максимальным  и минимальным значением равна  127-106=21.

В таблице приведены оценки основных дескриптивных статистик признака SP для каждой из двух этих подгрупп признака TIME.

 

TIME Mean N Std.Dev. Coef.Var. Variance Std.Err. Range Median Max Min
1 140,35 354 8,84 6,3 78,2 0,47 50 140 166 116
2 119,54 354 4,66 3,9 21,71 0,25 21 120 106 127

 

    Итак, основные отличия двух приведённых выше гистограмм  распределения SP в подгруппах TIME=1 и TIME=2, не только в структуре вершин, но и в интервале значений признака SP. Значения двух приведённых выше размахов различаются в 2,4 раза, а дисперсии (Variance) отличаются в 3,6 раза.Проверка гипотезы нормальности распределения значений этого признака, с помощью упомянутых выше статистических критериев,  отвергла нормальность распределения значений признака SP в обеих подгруппах. Подобные ситуации служат примером того, что при сравнении параметров распределения количественных признаков в отдельных группах, необходимо сравнивать не только средние, но и дисперсии.

  О необходимости проведения подобных сравнений свидетельствует и тот факт, что практически для всех количественных признаков, анализируемых в проведении исследований в медицине, указываются референтные интервалы. Например, для эритроцитов указывается интервал (3,100 – 5,700)*1012 /л, для гемоглобина указывается интервал (122,000 – 168,000) г/л, и т.п. Очевидно, что в этих случаях оптимальными могут считаться те группы, в которых не только средние значения близки к конкретным рекомендуемым значениям, но также в этих группах дисперсия имеет минимальное значение. То есть значения конкретного признака, у анализируемых наблюдений, ближе к оптимальному значению, а не к минимальному или максимальному.

  Однако для проверки гипотез о равенстве и неравенстве групповых дисперсий, вначале необходимо сделать выбор соответствующего статистического критерия. Как известно, первым таким критерием был предложен критерий Фишера – Снедекора. Чаще всего этот критерий называют просто F-критерием Фишера. Значение этого критерия равно отношению двух дисперсий. Причём в числителе должно быть помещено значение максимальной дисперсии, а в знаменателе – дисперсия из второй группы. То есть, используя приведённые выше в таблице значения двух групповых дисперсий, получаем значение F-критерия равное F=78,2/21,71 = 3,6.

  Однако теория F-критерия базируется на том, что исследуемые дисперсии получены в обеих группах с нормальным распределением значений признака. И если проверка нормальности распределения в одной, или в обеих группах, не подтверждает нормальный закон, то при проверке гипотез о равенстве двух дисперсий использовать F-критерий Фишера нельзя. В разделе 4.4. «О проверке однородности двух независимых выборок» издания [61], достаточно подробно описывается специфика проверки гипотез равенства групповых средних и дисперсий.  В частности, упоминается и о том, что при проверке гипотезы равенства двух дисперсий с помощью F-критерия Фишера, распределения значений признака в обеих сравниваемых группах должны иметь нормальный закон. А в том случае, если нормальный закон распределения в обеих группах сравнения не подтверждается упомянутыми выше критериями, то соответственно критерий Фишера использовать нельзя. И этот аспект весьма подробно описывается в большинстве материалов посвящённых F-критерию Фишера.

    При чтении этого аспекта, у читателя, не очень хорошо знающего теорию этого критерия, возникает резонный вопрос: А почему же в этом случае нельзя использовать F-критерий? Попробуем кратко объяснить эту особенность данного критерия. Итак, значение F-критерия равно отношению двух дисперсий. При этом распределение случайной величины, называемой F-отношением, определяется отношением двух дисперсий, величин, каждая из которых должна подчиняться распределению Пирсона Хи-квадрат:

              (5)

где m – степени свободы для распределения дисперсии в числителе, а n – степени свободы в знаменателе.

   Теперь следует напомнить, а как же получается распределение Пирсона Хи-квадрат? Данное распределение непосредственно связано с нормальным распределением. В частности, если стандартизованное нормальное распределение с нулевым средним и единичным стандартным отклонением, возвести в квадрат, то оно и будет подчиняться распределению Пирсона Хи-квадрат. Данный закон распределения был получен Пирсоном в 1900 году. Этот аспект построения распределения Пирсона описан практически во всех учебниках статистики.

    Очень ясно и доступно для медиков и биологов, это описание приведено в популярном издании [18]. В 11 главе «Теоретические распределения, используемые в статистических выводах» данного издания, достаточно подробно описаны следующие распределения: нормальное; Хи-квадрат; F-распределение; t-распределение. В отдельных четырёх разделах подробно описана основа каждого из этих четырёх распределений. Причём примеры этих распределений хорошо иллюстрируются вполне ясными и доступными графиками. А в конце этой главы, в разделе 11.5 «Соотношение между нормальным, t-, Хи-квадрат и F-распределениями», приведены формулы, показывающие функциональные взаимосвязи этих распределений между собой. Ниже приведём начальный фрагмент этого раздела на стр. 214:

   Таким образом, если распределение значений количественного признака в одной подгруппе сравнения не подчиняется нормальному закону, то в этом случае распределение получаемой дисперсии по данной подгруппе не подчиняется закону распределения Пирсона Хи-квадрат. Следовательно, и отношение двух дисперсий, обозначаемое как F, также не подчиняется распределению Фишера. Аналогичный вывод получается и в том случае, когда нет нормального распределения в обеих сравниваемых подгруппах. Следовательно, не проверяя нормальность распределения количественного признака в каждой из групп сравнения, исследователь, используя такие параметрические критерии, как t-критерий Стьюдента, Хи-квадрат Пирсона, и F-критерий Фишера-Снедекора, фактически получает не только весьма сомнительный результат, но и результат противоположный истинному.

    То есть, подтверждают нулевую гипотезу равенства средних или дисперсий, когда в действительности эта гипотеза отвергается, или наоборот. Поскольку в реальных, анализируемых количественных признаках, нормальный закон распределения подтверждается достаточно редко. Этот факт известен уже давно и упоминается во многих популярных изданиях по статистике. Например, в книге Шторм Р. «Теория вероятности и математическая статистика»  (М.: Мир. 1970. – 368 с.) на странице 67 читаем: «Следует, однако, подчеркнуть, что на практике часто приходится иметь дело со случайными величинами, распределёнными не по нормальному закону».

  А в книге Орлова А.И. «Прикладная статистика» (М.: Издательство «Экзамен», 2004. – 656 с.) на стр. 164 читаем: «В лаборатории прикладной математики Тартуского государственного университета проанализировано 2500 выборок из архива реальных статистических данных. В 92% гипотезу нормальности пришлось отвергнуть. …  Это означает, в частности, что большинство применений критерия Стьюдента, классического регрессионного анализа и других статистических методов, основанных на нормальной теории, строго говоря, не является обоснованным. Поскольку неверна лежащая в их основе аксиома нормальности распределений соответствующих случайных величин».  

    Об этом же читаем и на стр. 166: «В большинстве случаев распределения существенно отличаются от нормальных». А вот как данный аспект описывается в книге [7] на стр. 61. «Нормальное распределение.  Симметричная колоколобразная кривая была открыта Абрахамом де Муавром в 1733 году. … Однако для большинства физиологических случайных величин распределение имеет тенденцию к большей сглаженности, одновершинности и несимметричности, и диапазон среднее ± 2 среднеквадратичных отклонения не охватывает 95% значений». То есть автор издания как раз и утверждает, что большинство физиологических величин не имеют нормального распределения.

   В большом количестве исследований массивов данных по медицине, биологии, зоологии, агрохимии, экономике, металлургии, а также и по ряду специальных направлений, выполненных нами за последние 35 лет, нормальность распределения количественных признаков подтверждалась лишь в 5-10% случаев. И это можно трактовать как весьма надёжную информацию о том, что в большинстве случаев исследуемые количественные признаки имеют реальные взаимосвязи со многими другими качественными и количественными признаками. То есть отсутствие нормального распределения  является аргументом расширения списка проверяемых статистических гипотез о наличии подобных связей.

Следовательно, следует не только сравнивать групповые средние, то есть проверять наличие взаимосвязи между одним количественным и одним качественным признаком, но также производить иные сравнения, и анализ различных взаимосвязей. При этом учитывая наличие не только парных взаимосвязей признаков, но и наличие цепочек многомерных взаимосвязей. То есть следует использовать и различные многомерные методы анализа. Отметим, что данный факт фиксируется лишь практикующими исследователями, выполняющими проверки гипотез о нормальном законе распределения.

Если в Яндексе сделать запрос на выражение «как часто встречается нормальный закон распределения», то получим 2 млн результатов. Естественно, что в большинстве этих ссылок рассматриваются теории нормального закона. И во многих ответах можно прочитать выражения типа «Нормальный закон распределения наиболее часто встречается на практике». Однако при этом автор не уточняет, в какой конкретно практике нормальный закон встречается наиболее часто. Также в этих страницах кроме теории нормального закона распределения, не приводятся практические примеры проверки гипотез нормальности. То есть данные выражения написаны не практикующими статистиками, у которых нет реальных знаний о частотах нормального распределения признаков.

  Иные утверждения о частоте встречаемости нормального закона читаем на страницах написанных практикующими статистиками. Так по  ссылке "Большая Энциклопедия Нефти Газа. Нормальный закон – распределение" читаем: «Нормальный закон распределения наблюдается в тех случаях, когда на признак явления действует много факторов, каждый из которых мало связан с большинством других, и влияние каждого фактора на конечный результат существенно меньше суммарного влияния всех остальных факторов». Там же приводится и фрагмент из книги Котельникова Р.Б. «Анализ результатов наблюдений» [33], из которого приведено это предложение.

   Вот что написано на странице 76 этой книги. «Установлено, что для многих наблюдений распределение отдельных полученных результатов по отношению к среднему значению измеряемой величины характеризуется законом нормального распределения я ошибок (закон Гаусса).  Нормальный закон распределения наблюдается в тех случаях, когда на признак явления действует много факторов, каждый из которых мало связан с большинством других, и влияние каждого фактора на конечный результат существенно меньше суммарного влияния всех остальных факторов. Необходимо отметить, что установившаяся терминология "нормальный закон распределения" может натолкнуть на мысль о том, что именно этому закону должны соответствовать "нормальные", "правильные" экспериментальные данные. В действительности же это не так. Для этого не существует особых объективных причин, и распределение Гаусса (и основанное на нём распределение Стьюдента и др.) хорошо описывает реальные данные не чаще, чем другие. Так, например, указывалось, что среди 250 серий анализов, включающих 50000 отдельных определений, только в 10-15% случаев достаточно хорошо выполняется нормальное распределение.

Примеры, приведённые выше в гл. 2, также показывают отклонения от закона Гаусса. Можно, по-видимому, сказать, что только в некоторых случаях, благоприятных для постулированных Гауссом положений, это распределение выполняется достаточно точно, как, например, в геодезии, астрономии, иногда в аналитической химии и т.п. Тем не менее, это распределение занимает в статистическом анализе особое положение, что связано и с традицией, и с огромным и тщательно разработанным, удобным для использования математическим аппаратом».

   Итак, факт наличия не нормального закона распределения, является, по сути, весьма ценным свойством исследуемого количественного признака. Поскольку это есть отражение наличия различных реальных взаимосвязей данного количественного признака как с качественными, группирующими признаками, так и количественными признаками. То есть наличие не нормального распределения, является весьма надёжным аргументом в пользу проведения исследований достаточно большого количества различных видов взаимосвязей этих количественных признаков.

  Если сделать в Яндексе поиск на выражение «история нормального закона распределения», то получим 6 млн результатов. Первые результаты по нормальному закону распределения внёс Абрахам де Муавр в 1733 году.  Далее нор­мальное распределение вновь открыли и исследовали Карл Фридрих Гаусс (1809 г.) и Пьер-Симон Лаплас (1812 г.), которые исследовали теорию ошибок измерений. Если внимательно прочитать много ссылок данного поиска, то станет ясно, когда доминирует нормальное распределение. Вот одно из таких объяснений: «Нормальное распределение возникает тогда, когда на изменение случайной величины действует множество различных независимых факторов, каждый из которых в отдельности не имеет преобладающего значения». В частности, доминирование нормального закона распределения имеется у погрешностей многократных измерений одной и той же конкретной величины. Например, электрического напряжения у одного и того же источника напряжения, или одной и той же температуры, или одного и того же веса, и т.п.

   В качестве подобного примера расскажу об одной ситуации, которую обнаружила примерно 30 лет назад моя бывшая студентка, которая училась на вечернем экономическом факультете  Томского госуниверситета. Эта студентка работала на одном оборонном предприятии, на котором в весьма большом количестве использовались такие драгметаллы, как золото, серебро и платина. Данные металлы применялись в технологии создания радиоэлектронных изделий. И данная студентка, работая лаборантом, ежедневно взвешивала несколько сотен образцов этих металлов, передавая их работающим инженерам и технологам. При написании курсовой работы данная студентка производила по моему предложению порядка 100 взвешиваний одного и того же образца драгметалла на одних и тех же аналитических весах. Этот образец взвешивался ею на данных весах в течение 3-х месяцев в разное время рабочего дня.

 Анализ полученных взвешиваний показал, что получаемые при этом значения веса одного и того же образца драгметалла, взвешиваемого на одном и том же весовом устройстве, имели нормальное распределение. Однако при этом было установлено, что с течением времени средние значения веса одного и того же образца драгметалла уменьшались. То есть, вес неизменного конкретного образца драгметалла, через 3 месяца становился несколько меньшем, чем ранее, в самом начале серии его взвешиваний. Сравнение средних значений показало статистически значимое уменьшение средних весов на многих аналитических весах. При этом с течением времени изменялись и значения  дисперсий получаемых весовых значений. И это при том, что сам образец оставался неизменным и недоступным для откусывания от него каких-либо фрагментов.

  Отметим, что данная курсовая работа была предложена ввиду того, что со слов данной студентки в её лаборатории часто обнаруживалась недостача драгметалла. По результатам этой курсовой работы руководству соответствующего отдела было предложено сократить интервалы времени между проверкой и отладкой данных аналитических весов. В результате чего данный недостаток технологии взвешивания, обусловленный весьма большим количеством взвешиваний на одних и тех же весах, был ликвидирован.

   Напомним о весьма важной особенности функции плотности нормального распределения, называемой правилом 3 сигм, т.е. правилом 3 стандартных (среднеквадратичных) отклонений. Выше были приведены графики функции нормального распределения, согласно которой в интервалах ±s,  ±2s, и  ±3s от среднего значения, должны быть 68,26%, 95,44% и 99,72% всех анализируемых наблюдений. Естественно, что при отклонении гипотезы нормального отклонения в этих интервалах фиксируются частоты, весьма существенно иные. То есть либо гораздо меньшие, либо гораздо большие. Рассмотрим специфику не нормального распределения, при котором в нарушение правила 3 сигм наблюдается существенно меньшие частоты в указанных интервалах. То есть различия сравниваемых групп могут проявляться не только в различиях средних значений, но также и в различиях дисперсий.

    Для проверки гипотез равенства дисперсий в группах с нормальным распределением, можно использовать такие популярные критерии, как Фишера, Бартлетта, Хатрли, Кохрана, и т.д. А в том случае, когда гипотезы нормальности отвергаются, то достаточно эффективно проверять гипотезы равенства дисперсий с помощью непараметрических критериев Ансари-Бредли [90] и Сиджела-Тьюки  [95].

  Вернёмся к рассмотренному выше примеру анализа признака SP. Напомню, что основные отличия двух приведённых выше гистограмм  распределения SP в подгруппах TIME=1 и TIME=2, были в том, что в первой подгруппе распределение плосковершинное, а во второй подгруппе распределение островершинное. А также в различном виде асимметрий двух этих распределений. Об основных причинах подобных распределений, мы писали ещё в своей книге  [37] на стр. 22-28. Так на стр. 25 этой книги приводится следующая гистограмма с плоской вершиной:

 

Причиной возникновения плосковершинного распределения в этом издании назван сдвиг, дрейф центра распределения в подгруппах, которые в совокупности образуют анализируемую единую группу. Выше уже сообщалось, что упомянутый набор данных содержал 24 качественных признака. Просмотр распределений значений признака SP в отдельных подгруппах этих 24 признаков показал различные результаты. То есть в некоторых подгруппах расположение гистограмм различалось не очень сильно. То есть упомянутый сдвиг, дрейф центра распределения, был не велик. А в других подгруппах такие сдвиги были весьма существенными. Ниже приведён пример такого различия гистограмм признака SP в двух подгруппах по признаку PAT при значениях признака TIME=1  и GROUP=1:

В приведённой ниже таблице видно, что в группе PAT=2 стало больше не только среднее значение признака SP, но также и дисперсия (Variance), коэффициент вариации и размах.

TIME PAT N Means Median Std.Dev. Coef.Var Variance Std.Err. Range
1       1 151 133,18 132,00 4,48 3,37 20,11 0,36 20,00
1       2 203 146,15 145,00 6,93 4,74 48,04 0,49 34.00

Проверка гипотез нормальности распределения признака SP упомянутыми выше критериями, раздельно в каждой из двух этих подгрупп, также отвергла нормальность обоих распределений. Гораздо большая дисперсия признака SP в группе сравнения PAT=2, по сравнению с группой PAT=1, является аргументом в пользу того, чтобы провести отдельное исследование разных взаимосвязей в этой второй группе. Поскольку одной из причин такой большой дисперсии может быть различие между собой нескольких иных подгрупп сравнения, что и приводит к существенному возрастанию дисперсии. Такие сравнения были произведены в группах по 23 качественным признакам. Общее количество этих групп равняется 55. Во многих сравнениях были обнаружены статистически значимые различия, как средних величин, так и дисперсий.

Ниже приведён  график с тремя гистограммами распределений  признака SP по 3 группам признака PAT, которые входят в группу GROUP=2 при TIME=1. Кривые линии отображают теоретические функции плотности для трёх этих групп наблюдений по признаку SP.

  

На данном графике видим, что все 3 распределения перекрываются друг с другом. И при этом отчётливо видно смещение параметров этих групп в сторону увеличения. В частности, в группе PAT=1  среднее значение M=119,45, а дисперсия s2= 22,68. В группе PAT=2 среднее значение M=131,84, а дисперсия s2= 32,34;  в группе PAT=3  среднее значение M=146,15, а дисперсия s2= 48,04.  То есть увеличиваются значения не только средних, но и дисперсий. Ниже представлены раздельно три этих гистограммы. 

А теперь сделаем аналогичный анализ для двух этих групп PAT при значении TIME=2.

TIME

PAT

N

Means

Median

Std.Dev.

Coef.Var.

Variance

Std.Err.

Range

2      

1

174

119,31

120,00

4,66

3,90

21,68

0,35

21,00

2      

2

180

119,77

120,00

4,66

3,89

21,74

0,35

20,00

 

   Итак, в этих группах параметры распределения почти равны практически все. Проверка гипотезы нормальности распределения значений этого признака, с помощью критериев Шапиро-Уилка и Колмогорова-Смирнова с правкой Лиллиефорса, не отвергла эти гипотезы. Приведённые выше графики с гистограммами для количественной переменной SP, являются с одной стороны отражением вида распределения, – нормального, или не нормального, а с другой стороны и графическим отображением наличия или отсутствия взаимосвязи между переменной SP и группирующим признаком. Выше мы сообщали о том, что для 32 количественных переменных, при наличии 24 качественных признаков, можно (и следует!) исследовать 32*24=768 взаимосвязей. А поскольку гистограммы строились для разных комбинаций пары группирующих признаков, – PAT и TIME, то очевидно, что количество подобных парных взаимосвязей может быть равно не 768, а значительно больше. Например, для каждой из двух отдельных градаций группирующего признака TIME можно исследовать  23*32=736 парных взаимосвязей. А общее количество таких взаимосвязей для двух этих градаций будет равно 736*2=1472.

Если сделать аналогичные расчёты и для других группирующих признаков, то это суммарное количество станет весьма огромным. Напомню, что в подобных ситуациях исследователю следует принимать решение о количестве анализируемых взаимосвязей в результате обсуждения этих деталей с профессиональным статистиком.Не менее актуальным является процедура сравнения долей, пропорций для качественных признаков. То есть производится проверка гипотезы равенства, например, пропорций Р1 и Р2 в популяциях (генеральных совокупностях), из которых были взяты две анализируемые выборки, и получены выборочные значения пропорций р1 и р2. Две альтернативные статистические гипотезы, для подобных сравнений, можно записать следующим образом:H0: Р1 = Р2;  H1: Р1 ≠ Р2.  В качестве примера проверки подобной статистической гипотезы, воспользуемся описанием из [83], приведённым на стр. 34-35. Пропорции для выделенного признака в двух независимых выборках

 

Размер выборки Пропорция
Выборка 1
Выборка 2
Объединённая
n1.
n2.
n..
p1 (=n11/ n1.)
p2 (=n21/ n2.)
p.. (=n.1/ n..)

 

Значение n.1 вычисляется по следующей формуле:   n.1 = n1.* p1 + n2.* p2 . Для проверки статистической значимости разности между p1 и p2 оценивается z-статистика с  помощью следующей формулы:

   (6)

Напоминаем, что детали сравнения двух долей, и приведённой выше формулы, приведены в книге [83], стр. 34-35.  В качестве примера сравнения двух подобных долей, используем табл. 2.7 со стр. 35 [83]:

 

Размер
выборки

Пропорция объектов с признаком В

Наличие А 
Отсутствие А
Всего

150
50
200
0,10 = p1
0,20 = p2
0,125 = p..

Напомним, как вычисляется значение p.. :

p.. = (150*0,1 + 50*0,2)/200 = (15+10)/ 200 = 25/200=0,125

     (7)

Если величину z = 1,604755  возвести в квадрат, то получим значение z2 = 2,575238 ?2,58. Это значение приведено в выражении (2.2) на стр. 29 , при анализе 4-х клеточной таблицы сопряжённости  [83].     

       В задачах сравнения долей (пропорций) полезна также оценка доверительного интервала для разности между этими независимыми пропорциями. Достаточно подробно эта оценка описана на стр. 41-42  в [83]. Ниже приведём фрагмент этого описания с формулами и образцом расчёта такого доверительного интервала. «Когда допускается, что пропорция Р1 и Р2 могут быть неравными, хорошей оценкой стандартной ошибки разности р1 – р2 является следующая:

 

где q1 = 1- p1 и q2 = 1- p2 .  Предположим, что n1. n2. велики в том смысле, что ni* pi ≥ 5  и  ni*qi ≥  5 для i=1,  2 и что требуется построить 100 (1–α) %-ный доверительный интервал для разности Р2 – Р1 . Пусть сα/2 обозначает величину, отсекающую долю вероятности α/2 от верхнего хвоста стандартной нормальной кривой (1– α/2) – квантиль» [83].

ЛГДИ ≤ Р2 – Р1 ≤ ПГДИ,

где ЛГДИ – Левая Граница Доверительного Интервала;

       ПГДИ –Правая Граница Доверительного Интервала.

Ниже приведём формулы для ЛГДИ и ПГДИ.

  Данный интервал ЛГДИ ≤ Р2 – Р1 ≤ ПГДИ таков, что будет включать истинную разность пропорций приблизительно в 100*(1– α)% случаев.

«Рассмотрим, например, данные из табл. 2.7. Выборочная разность есть p2 – p1 = 0,10 , и оценка её стандартной ошибки

Приближённый 95%-ный  доверительный интервал для истинной разности равен 0,10–1,96*0,062 – 0,013 ≤Р2 – Р1 ≤0,10 + 1,96*0,062 + 0,013. Или  0,035 ≤Р2 – Р1 ≤ +0,235. Интервал включает значение 0, что согласуется с полученным ранее отрицательным результатом (см. уравнение (2.6)) при попытке найти значимое различие между p1 и  p2» [83].

  Приведённые выше формулы несложно реализовать в пакете EXCEL.

   Сравнения групповых средних и дисперсий являются важными процедурами статистического анализа исследуемых массивов данных. Однако следует помнить, что используемые групповые признаки не всегда достаточно полно и адекватно выражают наличие фактически имеющихся группировок наблюдений. То есть помимо установленных, зафиксированных групп наблюдений, очень часто в анализируемой генеральной совокупности (популяции), из которой взяты анализируемые массивы наблюдений, есть и скрытые, латентные группировки.  И такие скрытые группировки следует обязательно обнаруживать, используя различные методы. Например, метод кластерного анализа [1, 24, 53, 81].

   Алгоритмы  кластерного анализа содержат сравнения между собой наблюдений. Например, если по всем признакам два наблюдения идентичны, то есть «расстояние» между этими двумя наблюдениями равно нулю, то эта первая пара образует первый кластер. И далее с этим кластером сравниваются другие наблюдения, или другие кластеры. Отмечу, что кластерный анализ содержит очень большое количество различных алгоритмов сравнения и кластеризации. В результате применения этого метода сравнений наблюдений, в анализируемом массиве наблюдений обнаруживаются скрытые, латентные группировки наблюдений – кластеры. Ниже приведён график с дендрограммой, полученной в результате процедуры кластерного анализа наблюдений ранее упомянутого массива, по одному из популярных алгоритмов. Структура данной дендрограммы свидетельствует о наличии нескольких латентных группировок наблюдений. В частности, двух, трёх и четырёх кластеров.

    Наличие подобных латентных группировок активирует сравнение этих установленных групп. В частности, сравнение и групповых средних, и дисперсий, и т.д. Сравнение этих групп (кластеров) позволит проверить не только равенство/неравенство средних значений количественных признаков, но и взаимосвязи этих кластеров со всеми качественными, группирующими признаками, а также установить их структуру с помощью такого мощного метода, как логистическая регрессия. При этом для интерпретации структуры этих выявленных группировок наблюдений, обязательно следует произвести упомянутые выше методы сравнения и взаимосвязей.

Далее:

Что сравнивать в корреляции и регрессии?

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Отзывы заказчиков по статистическому анализу данных

«Роющая деятельность кабана». Статья в "Независимой" газете...

Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

23 примера оформления данных, их описания и описания целей исследования.

Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева
ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко
  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская
"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с. Актуальность этого издания весьма велика. По-прежнему в биомедицинских статьях и диссертациях публикуется масса статистических нелепостей, как образцы "статистического самоудовлетворения" и "статистического макияжа". Например, в двух диссертациях, выполненных в 2014 и 2015 гг. в Алтайском медуниверситете по разным специальностям, но при этом в полностью идентичных описаниях, состоящих из 94 слов, написано следующее. «Полученные данные были статистически обработаны с использованием программ Microsoft Offis Exel 2007. Достоверность различий между средними величинами определяли с помощью критерия значимости Стьюдента (t). Нормальность распределений в группах оценивали по критерию Шапиро-Уилка». Далее сообщается об использовании критерия Манна-Уитни, и т.д. Очевидно, что под Offis Exel авторы подразумевали Office Excel. Сложнее было бы об этом догадаться, если бы авторы написали Offis Exul. Вывод: оба диссертанта, как и члены двух диссертационных советов, не знают многого, в том числе описанного в этой книге. Например, не знают того, что в пакете Office Excel нет критериев Шапиро-Уилка и Манна-Уитни. Данная книга обучит правильно и хорошо описывать и понимать результаты статистического анализа. Поэтому исследователи станут более качественно выполнять статистический анализ, получая правильную технологию лечения пациентов. Что в результате будет снижать смертность населения, а также себестоимость лечебных процедур.

  Приложение к русскому изданию книги «Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов».
Авторы: Т. А. Ланг, М. Сесик. Перевод с англ. под ред. Леонова В.П. Изд-во:
Практическая Медицина, 2016.
  В приложении приведён список 209 полезных изданий по использованию статистики в биомедицине.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с. Предыдущие издания оригинала этой книги были опубликованы в 2000, 2005 и 2009 гг. Третье издание книги, как и два предыдущих, имеет целью донести до читателя основные понятия и принципы медицинской статистики, которые достаточно широко используются зарубежными медиками и биологами. Книга содержит необходимую теоретическую часть, а также в доступной форме даёт практическое описание того, как могут применяться статистические методы в реальных клинических исследованиях. Низкий уровень использования статистики в отечественной медицинской науке является одной из основных причин, по которым уже 111 лет Нобелевские премии по медицине не присуждаются россиянам. Ценность этой книги для медицинской науки определяется и проводимой в России реформой отечественной науки, в том числе реформой ВАК и системы научной аттестации. Учебное пособие предназначено для студентов, аспирантов и докторантов медицинских вузов, биологических факультетов университетов, врачей, исследователей-клиницистов и всех, кто является сторонником доказательной медицины.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.
Издание представляет собой вводный курс по принципам статистики. Представлены базовые понятия и принципы статистических исследований применительно к медицине. В отличие от большинства подобных изданий, указанные темы изложены кратко и доступно. Для чтения книги не требуется знание сложных разделов высшей математики, вполне достаточно тех, что даются в школе. Внедрение в практику принципов доказательной медицины диктует необходимость понимания статистики. После знакомства с книгой читатель сможет критически оценивать многочисленные публикации, содержащие статистическую терминологию и результаты описанных исследований. Полученные знания помогут избежать ошибок в планировании биомедицинских исследований, а также в изложении их результатов. Большим преимуществом книги служат глоссарий и подробный предметный указатель.
Для студентов, аспирантов, научных работников, а также врачей всех специальностей.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.
Данная книга является наиболее популярным в мире руководством по доказательной медицине, ставшее известным и в России. Руководство предназначено для студентов и врачей. За 18 лет с момента первого издания в 1996 г., эта книга переведена на восемь языков (испанский, итальянский, китайский, немецкий, русский, французский, чешский, японский) и напечатана огромными тиражами. Руководство завоевало признание практикующих врачей, преподавателей и студентов во многих странах; по нему преподается медицина, основанная на доказательствах, в медицинских школах всего мира. В книге 17 глав, среди которых есть и глава "Статистика для неспециалиста". Эта главу мы дополнили большим списком русскоязычной литературы как по самой статистике, так и по биостатистике. А начинается книга с определения понятия "доказательная медицина". Итак, что же такое "доказательная медицина"? Что, чем, и зачем "доказывают"? Читайте эту книгу!


Логистическая регрессия в медицине и биологии. Леонов В.

В серии из 9 статей рассмотрены основы метода логистической регрессии. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии


Долгое прощание с лысенковщиной

Семинары по биометрике


КУНСТКАМЕРА. Обзор большой коллекции медицинских статей и диссертаций с существенными ошибками и нелепыми использованиями и описаниями методов статистики.

Экспозиция 1  Экспозиция 2  Экспозиция 3  Экспозиция 4  Экспозиция 5 Экспозиция 6  Экспозиция 7  Экспозиция 8   Экспозиция 9

Для удобства работы с экспонатами они отсортированы по фамилиям авторов, городам, в которых проживают авторы, и по организациям, в которых работают авторы, а также по научным специальностям

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Сравнительная характеристика показателей кардиореспираторной системы спортсменов и лиц, не занимающихся спортом, в условиях северного промышленного города", Тюменский государственный университет, Тюмень - 2006 г.

Новый экспонат КУНСTКАМЕРЫ - Диссертация «Анализ полиморфизма генов сердечно-сосудистой системы и системы детоксикации в различных возрастных группах Санкт-Петербурга». Обсуждаемая диссертация являет собой ярчайший пример того, какую злую шутку может сыграть с автором игнорирование проблемы множественных сравнений при статистическом анализе полученных данных.

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Оценка проаритмических факторов при постинфарктной систолической дисфункции миокарда и эффективности их фармакологической коррекции", Кемеровская государственная медицинская академия, Кемерово - 2004 г.


Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения. Вот как пишет об этом известный специалист в области прикладной статистики профессор А.И. Орлов в своей книге ЭКОНОМЕТРИКА (Издательство ЭКЗАМЕН, Москва, 2004. - 576 с.). "Приведённые описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений  соответствующих случайных величин. Очевидно, для оправдания или обоснованного изменения существующей практики анализа статистических данных требуется изучить свойства процедур анализа данных при «незаконном» применении. Изучение процедур отбраковки показало, что они крайне неустойчивы к отклонениям от нормальности, а потому применять их для обработки реальных данных нецелесообразно; поэтому нельзя утверждать, что произвольно взятая процедура устойчива к отклонениям от нормальности". Именно Александр Иванович в своём письме от 4 апреля 1998 г. и обратил моё внимание на эту проблему.


Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.

Отзывы читателей обзора "Статистика в кардиологии. 15 лет спустя". В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...


ВАК для учёных? или ВАК для… бумагомарак? «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год. За 2 года, прошедших с момента публикации этой статьи, её прочитали более 29 тысяч читателей.  "Плагиат, обнаруживаемый в диссертациях, это «пена» диссертационного бизнеса. Поскольку в производстве диссертаций «под заказ» гораздо легче просто копировать фрагменты одних диссертаций, вставляя их в очередные заказные диссертации. Производители такого «товара» фабрикуют не только диссертации, но и массу журнальных статей. Основные причины появления этого бизнеса описал профессор Е.В. Балацкий ещё в 2005 г. [1-2], изложив и сценарии его ликвидации. Одной из ключевых причин рождения этого бизнеса являются изменения в Положениях ВАК".

Балацкий Е.В. Диссертационная ловушка


Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА.
КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?
ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ
.
«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».
КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 
ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.
«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН». ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.
КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?
ВМЕСТО ЗАКЛЮЧЕНИЯ.
Весь обзор
одним файлом


Отзывы читателей обзора Статистика в кардиологии. 15 лет спустя.

В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения.    

Н. Зорин. "Достоверность" или "статистическая значимость" - 12 лет спустя Изложены последствия неправильного употребления термина "достоверность" в российских медицинских публикациях. Даны рекомендации для исследователей и редакторов медицинских изданий по правильному и наиболее оптимальному употреблению упомянутых терминов и языка контекста.

Н. Зорин. О всё более полном удовлетворении растущих потребностей российского населения в оценке технологий здравоохранения. Часть I. Индустриальная модель медицины. Внедрение технологий. Проблемы терминологии.

Диссертационные войны. Как борьба с плагиатом в диссертациях переместилась из науки в политику

Балацкий Е.В. Диссертационная ловушка

МАТЕМАТИЧЕСКАЯ МОРФОЛОГИЯ.
ЭЛЕКТРОННЫЙ МАТЕМАТИЧЕСКИЙ И МЕДИКО-БИОЛОГИЧЕСКИЙ ЖУРНАЛ

БИОМЕТРИКЕ - 16 лет! А что было раньше? И что теперь?  Леонов В.П.
16 лет... Возраст немалый... Как появился наш сайт? И стал ли он популярным?
Первоначально наш сайт был разделом на сайте Доктор.Ру, который был создан в Хабаровске. Вот как выглядел этот раздел, например, 20 июля 2001 года. Поскольку в те годы скорость передачи информации в интернете была невысокая, то для облегчения доступа к материалам БИОМЕТРИКИ мы открыли "зеркала" (копии) в таких городах, как Томск, Владивосток, Москва, Киев. В дальнейшем, когда сайт Доктор.Ру переехал в Москву, был сделан отдельный хостинг БИОМЕТРИКИ в Томске. Со временем необходимость наличия "зеркал" сайта в других городах отпала, и БИОМЕТРИКА осталась в Томске. Читатели БИОМЕТРИКИ в своих письмах часто задают вопрос о том, каковы были мотивы создания этого сайта? Чтобы немного рассказать об этом, вернёмся на 28 лет назад, в прошлое.

Статистика в кардиологии. 15 лет спустя. Леонов В.П.

15 лет назад, в 1998 году, в журнале «Кардиология» была опубликована наша статья  «Применение методов статистики в кардиологии (по материалам журнала «Кардиология» за 1993–1995 гг.) В нём были проанализированы 426 статей кардиологической тематики. В новом обзоре проаналированы современные журнальные статьи кардиологической тематики. Учитывая то, что  в настоящее время в России смертность от сердечно-сосудистых заболеваний более чем в 4 раза выше, чем в Европе, США и Японии, актуальной задачей является оценка эффективности использования статистики в российской кардиологии. (Весь обзор одним файлом)

Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.). Леонов В.П. Кардиология, 1998, № 1, с. 55-58.

Леонов В.П. Общие проблемы применения статистики в биомедицине, или что разумнее: ДДПП или ДППД? 

Новые отзывы на проведённый анализ данных

Хван Н.В., Алматы, Казахстан Уважаемые диссертанты! Хочу поделиться своим опытом сотрудничества со специалистами Центра «Биостатистика».

Гражданкина Д.В., НГМУ, Новосибирск
. Работаю я ассистентом кафедры эндокринологии Новосибирского медуниверситета. Вопрос о том, как и кому выполнять статистический анализ данных для диссертаций, статей по медицине, волновал меня довольно давно...

Веселовская Н.Г., Алтайский кардиоцентр, Барнаул. Хочется поделиться своими впечатлениями от работы с центром БИОСТАТИСТИКА. Итак, это не первое моё сотрудничество с центром. В 2006 г центром БИОСТАТИСТИКА был проведён анализ материала, который вошёл в мою кандидатскую диссертацию...   Веселовская Н.Г. "ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

Поддубная О.А., доктор медицинских наук, доцент кафедры Восстановительной медицины, физиотерапии и курортологии Сибирского Государственного медицинского университета

Медянникова И.В., кандидат медицинских наук, ассистент кафедры акушерства и гинекологии Омской государственной медицинской академии

Крупская Ю.А. (Ростов-на-Дону)

Чекмарев А.С., аспирант кафедры дерматовенерологии, микологии и косметологии РМАПО, член совета студентов медицинских и фармацевтических ВУЗов при Министерстве Здравоохранения и Социального развития России (Москва)

Максимова С.С., с.н.с. НИИ здоровья, Якутск

Новые отзывы по дистанционному обучению статистике

Сафонова В.Р., Ханты-Мансийская госмедакадемия, кафедра нормальной и патологической физиологии 

Ванинцева Н.Н. Санкт-Петербург 

Бурмистрова Т.Г., лаборатория нарушений сердечного ритма РНПЦ Кардиология, Минск.

Карчевская К.В., Федеральный центр сердечно-сосудистой хирургии г. Пенза

Ереванская фото-биометрика. Фоторепортаж о конференции в Ереване.

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193. Почему и как надо учить медиков статистике?
В. Леонов.

В НОВЫЙ ВЕК - С ДОКАЗАТЕЛЬНОЙ БИОМЕДИЦИНОЙ

ОТВЕТ  ВАК РФ   АВТОРАМ СТАТЬИ  


1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"