Яндекс.Метрика

Статистика в медицине

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
".
Д. Дидро

Статистика посещаемости БИОМЕТРИКИ

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
25 наиболее популярных ссылок, посещаемых нашими читателями
http://www.biometrica.tomsk.ru/comp_aver.htm
http://www.biometrica.tomsk.ru/erevan_8.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/UNESCO%202010.pdf
http://www.biometrica.tomsk.ru/zakaz.htm
http://www.biometrica.tomsk.ru/zakaz_28.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/STAT_CARDIO_2014.pdf
http://www.biometrica.tomsk.ru/logit_9.htm
http://www.biometrica.tomsk.ru/stat_cardio7.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/percent_00.htm
http://www.biometrica.tomsk.ru/lis.htm
http://www.biometrica.tomsk.ru/kamchat.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/zakaz_15.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

Критерий Колмогорова-Смирнова:

особенности применения

Анализ журнальных публикаций и диссертаций по биомедицине обнаруживает, что в ряде случае авторы исследований используют критерий Колмогорова-Смирнова не совсем верно понимая специфику этого критерия. В итоге авторы трактуют полученные ими результаты ошибочно, искренне заблуждаясь в своих выводах. Известность научных организаций, в которых выполнялись эти исследования, ученые степени и звания авторов таких работ способствуют некритическому восприятию таких работ, и, как следствие, ошибочные выводы начинают далее самостоятельную, и подчас продолжительную, жизнь. Эти же причины способствуют и тому, что для неопытных исследователей эти работы становятся примерами для подражания, мемами, порождая тем самым дальнейшую цепь ошибочных выводов. К каким возможным отрицательным последствиям эти заблуждения могут привести в дальнейшем, очевидно проследить невозможно. "Нам не дано предугадать, как наше слово отзовется...". 

Наибольшее распространение среди таких исследователей получило следующее заблуждение, связанное с этим критерием.  В том случае, когда распределение признака не подчиняется нормальному закону, авторы производят проверку гипотезы о равенстве двух генеральных средних с помощью критерия Колмогорова-Смирнова, считая его вполне адекватной заменой t-критерию Стьюдента (Пленарный доклад "Цитогенетические эффекты ядерно-химического производства". Пузырев В.П., Назаренко С.А., Попова Н.А. Медицинские и экологические эффекты ионизирующей радиации (к 15-летию аварии на Чернобыльской АЭС): Материалы 1 международной научно-практической конференции, 21-22 июня 2001 года. Северск-Томск./ ред. Р.М. Тахауов, Л.В. Капилевич, А.Б. Карпов - Томск, 2001. - 144с.) для независимых выборок. Получив значение достигнутого уровня значимости "р" меньше 5% авторы ощибочно трактуют этот результат только как неравенство двух генеральных средних, делая на основании этого ошибочный вывод о том, что "... у 70% обследованных работников СХК и жителей г. Северска отмечается существенное повышение частоты как хромосомных аберраций нерадиационной природы, так и уровня СХО." В немалой степени такая ситуация предопределена еще и доминирующей среди отечественных медиков и биологов статистической парадигмой, согласно которой основное различие опытной и контрольной групп заключается лишь в одном изменении такого параметра распределения, как среднее. Именно по этой причине примерно в 60% отечественных биомедицинских статей и диссертаций используют t-критерий Стьюдента для проверки подобной гипотезы, тогда как за рубежами России его используют всего лишь в 11% публикаций. 

Учитывая, что достаточно подробное описание критерия  критерия Колмогорова-Смирнова в отечественной литературе встречается достаточно редко, приведем несколько цитат из ряда изданий,  после чего более подробно опишем специфику данного критерия. 


1. 
ВЕРОЯТНОСТЬ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. ЭНЦИКЛОПЕДИЯ.-  М.: Научное издательство "Большая российская энциклопедия", 1999. 

Стр. 244-245. 
"Колмогорова-Смирнова критерий - (Kolmogorov-Smirnov test) - собирательное название для статистических критериев, статистики которых выражаются через максимальное (минимальное) значение разности между выборочной и теоретической функциями распределениями или их оценками. Различают К.-С. к. для одной, двух и нескольких выборок." (Далее в тексте идет  речь о проверке гипотез однородности формула ). 
"Двухвыборочный критерий Смирнова основан на статистике Dm,n = sup |Fm (x)-Gn(x)|." 


2. 
ТАБЛИЦЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ. Большев Л.Н., Смирнов Н.В. -  М.: Наука, Гл. ред. физ-мат. литературы, 1983 - 416с. 

Стр. 80-89, 350-352. 
"Критерии однородности двух выборок.  ... Основная гипотеза Н0, подлежащая проверке, заключается в предположении, что обе выборки извлечены из одной и той же совокупности и, значит, функции распределения случайных величин (далее вместо греческой буквы "дзета" мы используем латинскую букву "d". - В.Л.) d и d' одинаковыформула, где Fn(x) - функция эмпирического распределения, построенного по выборке d1, d2, ..., dn." (Далее в тексте идет объяснение оценки самой статистики однородности, в котором используется величина D+m,n, где Dm,n= sup|Gm(x)- Fn(x)|.) 


3. 
СПРАВОЧНИК ПО ПРИКЛАДНОЙ СТАТИСТИКЕ. Под ред. Э. Ллойда, У. Ледермана. Том. 2. Перевод с английского под редакцией С.А. Айвазяна и Ю. Тюрина. М.: Финансы и статистика, 1990. - 526 с. 

стр. 117-118. 
"Критерий Смирнова для двух выборок также использует понятие эмпирической функции распределения. Но в этом случае нас интересует, являются ли две независимые выборки наблюдений выборками из одного и того же распределения. Точнее говоря, имеется случайная  выборка x1, x2, ..., xn из совокупности с непрерывной функцией распределения F(x) и независимая случайная выборка  y1, y2, ..., yn из совокупности с непрерывной функцией распределения  G(y).  Мы хотим проверить гипотезу 
H1: F(z)=G(z)  для всех  z 
против 
H2: F(z) <> G(z) для некоторых  z. 
Заметим, что мы не уточняем, какова на самом деле общая форма  F(z) и G(z)  в H1
По двум выборкам можно определить две эмпирические функции распределения Fn1(x) и Gn2(y). В двухвыборочном критерии Смирнова используется статистика Dn1,n2 = sup|Fn1(z)- Gn2(z)|,  которая является наибольшим отклонением между двумя эмпирическими функциями распределения."

4. 
НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ. Холлендер М., Вулф Д./Перевод с английского Д.С. Шмерлинга. Научное редактирование Ю.П. Адлера и Ю.Н. Тюрина. Предисловие Ю.П. Адлера, Ю.Н. Тюрина и Д.С. Шмерлинга. - М.: Финансы и статистика, 1983.  -518 с. 

Прежде чем привести описание интересующего нас критерия Колмогорова-Смирнова, обратим внимание на структуру данной монографии, которая считается одной из лучших по методам непараметрической статистики. Итак, приведем названия отдельных глав этой монографии: "Глава 3. Одновыборочная задача о положении (сдвиге)", "Глава 4. Двухвыборочная задача о положении (сдвиге)", "Глава 5. Двухвыборочная задача о рассеяниии (масштабе)", "Глава 10. Критерии, сконструированные для обнаружения произвольных альтернатив". Именно в этой, последней главе, и рассмотрен данный критерий. Обратите внимание на то, что в отличие от предыдущих глав, где речь идет о задачах проверки гипотез касающихся конкретных параметров распределений, таких, как мер положения (главы 3 и 4) и мер рассеяния (глава 5),  в названии главы 10 говорится о произвольных альтернативах, т.е. не уточняется о каких конкретных параметрах будут рассмотрены статистические гипотезы. Кстати, аналогичная классификация использована и в книге "КОМПЬЮТЕРНАЯ БИОМЕТРИКА"/ Под ред. В.Н.Носова. - М.:Изд-во МГУ, 1990. - 232с. А теперь приведем несколько цитат из этой монографии, касающихся сути данного заблуждения. 

Стр. 232. "Эта глава посвящена свободным от распределения критериям, предназначенным для обнаружения широких классов альтернатив. В 10.1 приведено описание двухвыборочного свободного от распределения критерия для гипотезы об идентичности двух совокупностей П1 и П2. Критерий предназначен для обнаружений всех возможных отклонений от этой гипотезы." 
Стр. 241. "10.6. Двусторонний критерий Колмогорова-Смирнова, основанный на J3, предназначен для обнаружения (см. свойство 1) всех альтернатив к H0(1). Для получения такой дополнительной защиты, мы жертвуем мощностью против частных подклассов (вроде сдвига параметра положения)." 


5.
СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ. Лотар Закс  (Пер. с нем. В.Н.Варыгина.) Под ред. Ю.П.Адлера, В.Г.Горского. - М.: Статистика, 1976. – 598 с.. 

стр. 268.
 "Если необходимо сравнить две независимые выборки измерений (или значений частот) и ответить на вопрос, относятся ли они к одной и той же генеральной совокупности, то наиболее строгим критерием однородности является критерий Колмогорова (1933) и Смирнова (1939). Он включает в себя проверку всех видов различия распределений, в особенности различия средних положений (среднее значение, медиана), рассеяния, асимметрии и эксцесса, т.е. различия функции распределения (см. также [Darling, 1957] [Kim, 1969])."  Это перечисление параметров распределений означает

ЛЮБЫЕ различия, ЛЮБЫХ параметров, без конкретизации каких именно.
 6.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. Ван дер Варден. М.: ИЛ,  1960, - 435c. 

Стр. 328. 
"Особым преимуществом критерия Смирнова является то, что этот критерий со сколь угодно большой вероятностью позволяет обнаружить любое отклонение между функциями распределения X и Y, если только  n достаточно велико. Таким образом, критерий Смирнова следует применять тогда, когда нужно проверить полное согласие функций распределения F(t) и G(t) случайных величин X и Y   во всем интервале изменения t и когда для этой проверки в нашем распоряжении имеется достаточно обширный материал наблюдений.Но если речь идет лишь о том, чтобы установить, не будет ли  X в среднем больше, чем  Y, то следует применять более мощные критерии, которые даже при небольших n  могут привести к решению поставленного вопроса.Такого рода критериями являются критерий Вилкоксона и критерий X, к изложению которых мы теперь и переходим." (Ниже, на стр. 357 автор сообщает о том, что мощность критерия X такая же, как у критерия Стьюдента, а на стр. 357 говорит о предпочтительности критерия Х перед t-критерием Стьюдента).


7.
STATISTICA: ИСКУССТВО ДАННЫХ НА КОМПЬЮТЕРЕ. ДЛЯ ПРОФЕССИОНАЛОВ. В.Боровиков.- СПб.: Питер, 2001. - 656с. 

Стр. 497.
"... двухвыборочнй критерий Колмогорова-Смирнова чувствителен не только к различию в положении двух распределений, но также и к форме распределения. Фактически он чувствителен к любому отклонению от гипотезы однородности, но не указывает, с каким именно отклонением мы имеем дело".



    Итак, если подвести итог, то из этих и других приведенных в литературе (ОСНОВНЫЕ ТАБЛИЦЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ. Ликеш И., Ляга Й. Пер. с чешского. М.: Финансы и статистика. 1985. - 356с. КОМПЬЮТЕРНАЯ БИОМЕТРИКА/Под ред. В.Н.Носова. - М.:Изд-во МГУ, 1990. - 232с.  СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ И ПРОВЕРКА ГИПОТЕЗ НА ЭВМ. Петрович М.Л., Давидович М.И., М.: Финансы и статистика, 1989. - 191с.  МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. П. Бикел, К. Доксам./Пер. с англ. Ю.А, Данилова Вып. 2. - , М.: Финансы и статистика, 1983. - 254с.  и др.) описаний двухвыборочного критерия Смирнова (он же критерий Колмогорова-Смирнова), становится ясно, что нулевая гипотеза однородности говорит об идентичности двух функций распределения. Принятие этой гипотезы автоматически означает и равенство всех соответствующих параметров этих распределений. Однако отклонение нулевой гипотезы и принятие альтернативной гипотезы не отвечает на вопрос о том, какие именно параметры не равны в сравниваемых распределениях. Об этом же, вторя Ван дер Вардену и В.Боровикову,  говорят и авторы популярной среди медиков и биологов книги "ПРИМЕНЕНИЕ НЕПАРАМЕТРИЧЕСКИХ КРИТЕРИЕВ СТАТИСТИКИ В МЕДИКОБИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ" Гублер Е.В. и Генкин А.А. (Ленинград, изд-во "Медицина", Ленинградское отделение. 1973, 142с.). В данной книге нет описания критерия Колмогорова-Смирнова, но в Предисловии (стр. 6) авторы говорят следующее. "Следует отметить, что применение непараметрических критериев статистики в медицине и биологии, несомненно, заслуживает более фундаментального изложения чем в предлагаемом издании. Представляет интерес более подробное изложение общих принципов непараметрической статистики, рассмотрение ряда непараметрических критериев различий (критерия Колмогорова-Смирнова, критерия Ван дер Варден и др." Итак, вот что пишут Гублер Е.В. и Генкин А.А. в своей книге. 

Стр. 16. 
"Глава 2. Критерии различий двух выборок. 
... Пятый и шестой критерии позволяют выявить как различия в средних тенденциях, так и иные различия между выборками. Бывают случаи, когда в опыте наблюдаются два противоположных типа реакций, например в части опытов повышение, а в другой части - понижение артериального давления. Средние значения в опыте и контроле в этом случае могут оказаться близкими, но распределения все же будут различаться. ... Если ... имеются просто две несгруппированные выборки, то для выявления любых различий в распределениях целесообразно применять серийный критерий r (Вальда-Вольфовица). Он позволяет статистически оценить достоверность вывода о существенных различиях между двумя группами наблюдений, но в чем именно эти различия состоят, остается неизвестным. Решение этого вопроса требует отдельного анализа." 

Итак, при использовании двухвыборочного критерия Колмогорова-Смирнова отклонение нулевой гипотезы об идентичности двух распределений и принятие гипотезы различия двух распределений не позволяет  утверждать, что это различие наблюдается именно для средних. С таким же успехом данное различие может наблюдаться и для других параметров распределения, тогда как средние в этом случае могут быть равными. Сама статистика Смирнова построена таким образом, что в ней игнорируются конкретные параметры распределений (средние, дисперсии и т.д.) Рассматриваются только функции распределения без конкретных параметров. 

 Проиллюстрируем сказанное выше графически. Для этого сгенерируем в пакете EXCEL две выборки данных, подчиняющиеся нормальному закону распределения. Объем каждой из выборок зададим равным 100. При этом генеральные средние (математические ожидания) зададим в обеих выборках равными 4, а значения генеральных стандартных отклонений (стандартов) отличающимися в три раза: в одном массиве равном 1, а в другом - 3. Выборочные значения средних и стандартов, естественно, будут несколько отличаться, в силу ограниченности выборок, от заданных теоретических величин. Так выборочные средние будут равны 3,959600 и  3,828200, а выборочные стандарты, соответственно, 1,085417 и  3,001538. Далее эти две выборки объединим в один массив DATA1.STA объемом 200 наблюдений, с группирующим признаком имеющим две градации: 1-я и 2-я группа.  Используем этот тестовый набор данных DATA1.STA  и построим совмещенные гистограммы распределения накопленной частоты. Данные гистограммы представлены ниже. 

На следующем  графике изображены эмпирические функции распределения сравниваемых групп, а также теоретические кривые нормальной функции распределения для каждой из групп. 

график функции распределения

Поскольку наши выборки изначально были сгенерированы с использованием нормального закона распределения, то видно, что эмпирические (фактические) функции распределения весьма близки к теоретическим. Далее мы покажем крупным планом один участок  этого графика, в том интервале значений переменной Х, для которого разница между двумя эмпирическими функциями распределения максимальна. Вертикальные отрезки со стрелками представляют собой те разности двух эмпирических функций, которые претендуют на максимальное значение, и одна из них, самая большая, будет использована в качестве статистики Смирнова  Dn1,n2 = sup|Fn1(z)- Gn2(z)|. 

Фрагмент изображения графика с функциями распределения

На следующем графике представлено распределение разностей сравниваемых эмпирических функций распределения F1 и F2, в зависимости от значения Х. Стрелками обозначены максимальные положительная и отрицательная разность. График построен с использованием программы разработанной профессором кафедры прикладной информатики ТГУ д.ф.-м.н. В.В.Поддубным.

Сравнение этих двух выборок в пакете S-PLUS 2000 с помощью критерия Колмогорова-Смирнова дает значение достигнутого уровня значимости  p-value = 0.0037.  Воспользуемся рекомендациями  Е.В. Гублера и А.А. Генкина и применим критерий Вальда-Вольфовица, использовав который получим значение достигнутого уровня значимости p-level равное 0,001816 . Всё это говорит о статистически значимом различии функций распределения, но не средних!

Рассмотренные выше особенности статистических критериев проиллюстрируем также с помощью аналогичным образом синтезированного массива данных DATA2.STA . В данном массиве имеются две группы наблюдений, в каждой из которых по 100 наблюдений. Количественный признак представлен переменной VAR1, группирующий признак - VAR2. Вторая группа была сконструирована из первой группы наблюдений специальным образом. В частности, после сортировки признака VAR1 в первой выборке по возрастанию, к первым 50 наблюдениям прибавили одно и то же число, тогда как от следующих 50 наблюдений это же самое число вычли. Полученные при этом новые значения признака VAR1 и составили вторую группу. В результате этой операции обе группы имеют идентичные средние (9,965234) и равные суммы значений (996,5234) переменной VAR1 в каждой из этих групп. Отличие же заключается в том, что первая группа имеет нормальное распределение с унимодальной гистограммой, тогда как вторая группа имеет ярко выраженное антимодальное распределение (провал в центре и по одной моде слева и справа) .  Гистограммы распределения этих групп приведены ниже. 

Гистограммы распределения признака VAR1 в двух группах (массив NAZARENKO.STA)

Проведем сравнение этих групп используя непараметрические статистики. Тест Вальда-Вольфовица указывает на статистически значимое различие двух распределений (см. ниже). 
STATISTICA.     Wald-Wolfowitz Runs Test (DATA2.STA) 
NONPAR    By variable VAR2 
STATS     Group 1: 1 Group 2: 2 

Valid N
Group 1 
Valid N
Group 2
Mean
Group 1
Mean
Group 2
Z
p-level
Z adjstd 
100
100
9,965234
9,965234
-3,68623 
0,000228
3,615340

О таком же различии говорят и результаты применения теста Колмогорова-Смирнова в пакете S-PLUS 2000 (см. ниже). 
S-PLUS 2000.  Two-Sample Kolmogorov-Smirnov Test
data:  x: V1 in DATA2.SAV , and y: V2 in DATA2.SAV
Dks = 0.22, p-value = 0.0156 
alternative hypothesis: 
cdf of x: V1 in DATA2.SAV does not equal the
cdf of y: V2 in DATA2.SAV for at least one sample point. 

 ***  Summary Statistics for data in:  DATA2.SAV ***
 


Group 1 Group 2
Min (Минимум)
1-st Qu (1-я квартиль)
Mean (Среднее)
Median (Медиана)
3-rd Qu (3-я квартиль)
Max (Максимум)
Total N (Общее число наблюдений)
Std Dev (Стандартное отклонение)
7.526174
9.358504
9.965234
9.931250
10.550065 
12.374363
100
1.006245
 7.931365
8.554207
9.965234
10.101192
11.350258
11.931135
100
1.393181
Однако все сравнения средних указывают на их идентичность, т.е. нулевая гипотеза равенства генеральных средних принимается, при отвержении гипотезы идентичности функций распределения!


С целью исключения подобных ошибочных выводов в большинстве зарубежных биомедицинских журналов все поступающие статьи проходят рецензирование на предмет корректности статистических выводов исследований. Для иллюстрации этого утверждения приведем некоторые выдержки из книги Стентона Гланца "Медико-биологическая статистика" (М.: Практика, 1998. - 459с.).

"Важность грамотного использования статистических методов осознается все шире. И, хотя ошибки не исчезли, все больше журналов прилагают усилия к их искоренению. Во многих из них рецензирование включает отдельный этап проверки статистической правильности предлагаемых работ. Приведу подтверждение, наиболее ощутимое для меня. Я являюсь внештатным редактором Journal of the American College of Cardiology, и моя работа состоит в выявлении статистических ошибок в поступающих работах. Доля статей, содержащих ошибки, составляет около половины, но теперь уже половины предлагаемых к публикации, а не опубликованных работ.." (стр. 16)

"Поиск новых методов диагностики и лечения, выбор наилучшего из уже принятых - везде статистические соображения играют не последнюю роль. Чтобы принять полноправное участие в обсуждении этих вопрососв, врач должен быть знаком с принципами и основными методами статистики. До сих пор медики редко участвовали в обсуждении статистических вопросов, на первый взгляд далеких от врачебной практики и носящих сугубо технический характер. Однако по мере ужесточения требований к использованию ресурсов медикам следует научиться проверять обоснованность претензий на эффективность и с большим пониманием участвовать в распределении средств. И основой для этого служит статистика." (стр. 20)

"Как мы видим, статистические ошибки встречаются примерно в половине статей. Однако дальнейшие исследования показали, что журналам, в которых взяли за правило обращать внимание не только на медицинскую, но и статистическую сторону дела, удалось существенно снизить долю ошибочных статей. Эта доля нимало не изменилась в тех журналах, которые так и не ввели статистического рецензирования.

  Врачам известно множество методов диагностики и лечения, эффективность которых была "доказана" статистическими методами и которые тем не менее канули в Лету, не выдержав проверки практикой. А сколь часто приходится читать статьи, в которых статистические манипуляции с одними и теми же данными приводят к прямо противоположным выводам. Все это наводит читателя на мысль, что статистические методы либо ненадежны, либо слишком трудны для понимания, либо вообще не более чем инструмент для недобросовестного исследователя. Между тем даже начального знакомства со статистикой в сочетании со здравым смыслом обычно достаточно, чтобы понять, что предлагает нам автор в качестве "доказательств". По иронии судьбы ошибки редко связаны с тонкими статистическими вопросами. Как правило, это простейшие ошибки, такие как отсутствие контрольной группы, использование неслучайных выборок или пренебрежение статистической проверкой гипотез. По неизвестным науке причинам такие ошибки неизменно смещают результаты исследования в пользу предлагаемого автором метода (Выделено нами. В.Л.).

Вред наносимый ошибками такого рода, очевиден. Исследователь заявляет о "статистически достоверном" эффекте лечения, редактор помещает статью в журнал, врач, неспособный критически оценить публикацию, применяет неэффективный метод лечения. В конце этой цепи находится больной, который и расплачивается за все, подвергаясь ненужному риску и не получая действительно эффективного лечения (Выделено нами. В.Л.). Не следует сбрасывать со счетов и ущерб от самого факта проведения бессмысленных исследований. Деньги и подопытные животные приносятся в жертву науке, больные рискуют ради сбора ошибочно интерпретируемых данных. 

Сегодня грамотная проверка эффективности лечения становится первоочередной задачей. Исследования должны тщательно планироваться, а результаты правильно интерпретироваться.

ОШИБКИ ВЕЧНЫ?
Поскольку описанные ошибки совершаются в массовом порядке, ничто не побуждает исследователей корректно использовать статистические методы. Редко кому приходилось слышать критические замечания на сей счет. Наоборот, исследователи часто опасаются, что их коллеги, а особенно рецензенты, сочтут грамотно и полно изложенную статистическую процедуру высокомерной теоретизацией.

Журналы призваны быть оплотом качества научных исследований. В некоторых редакциях действительно осознали, что их рецензенты не слишком сведущи в использовании элементарной статистики, и изменили саму процедуру рецензирования. Теперь, перед тем как направить рукопись на рецензию, ее тщательно проверяют на предмет правильности использования статистических методов. Результатом этого нередко становится пересмотр используемых в статье статистических методов, а иногда и самих выводов.

Но большинство редакторов, похоже, убеждены, что каждый рецензент рассматривает статистическую сторону работы столь же тщательно, сколь и собственно медицинскую. Неясно, однако, как он может это сделать - ведь даже авторы ведущих медицинских журналов, упоминая статистичекую проверку гипотез, редко затрудняют себя указанием, какой именно критерий был использован. Коротко говоря, для грамотного чтения медицинской литературы необходимо научиться понимать и оценивать правильность применения статистических методов, используемых для анализа результатов." (стр. 23-25).


Естественно, обсуждаемые выше проблемы взаимодействия "Автор-Редакция-Читатель" не ограничиваются только статистическими аспектами публикуемых статей. Однако этот аспект наиболее тесно связан с надежностью и достоверностью авторских выводов. Известнейший журнал British Medical Journal (BMJ)  в своих требованиях к рукописям статей, предлагаемых к публикации, прямо говорит о том, что редакция журнала в сомнительных случаях вправе требовать от авторов предоставления исходных данных для перепроверки выводов. Будем надеяться, что в скором времени аналогичные требования станут нормой в диссертационных советах и редакциях отечественных биомедицинских журналах, что повысит качество публикаций. 

   В 1940 г. академик А.Н.Колмогоров опубликовал в Докладах Академии Наук СССР (1940. Том ХХVII.  № 1.) статью "ОБ  ОДНОМ  НОВОМ  ПОДТВЕРЖДЕНИИ ЗАКОНОВ МЕНДЕЛЯ".  В этой статье, на основе данных Н.И. Ермолаевой (аспирантки академика Т.Д. Лысенко), Андрей Николаевич убедительно опроверг ложные выводы Н.И. Ермолаевой о том, что законы Менделя не верны. Именно эта статья и побудила нас открыть раздел КУНСТКАМЕРА. Однако доказать ложность выводов Н.И. Ермолаевой А.Н.Колмогоров смог только потому, что будучи абсолютно уверена в истинности своих выводов, она привела в своей статье все свои исходные данные. Полагаю, что и в наше время тем исследователям, которые также уверены в истинности своих результатов, имеет смысл предоставлять свободный доступ к  тем данным, на основе которых получены публикуемые результаты. 

© 2001. В.Леонов


P.S.
12  апреля 2003 г. исполнилось 100 лет со дня рождения Андрея Николаевича Колмогорова. Он обладал редким сочетанием математика-теоретика и естествоиспытателя-практика. Вместе с тем он был и философом науки, её популяризатором. В мировой науке, чтобы отметить достижения ученых в тех областях, по которым не присуждаются Нобелевские премии, учреждены Бальцановские премии. В 1963 г. было первое присуждение Бальцановской премии по математике, и её лауреатом  стал А.Н. Колмогоров. Это была высшая оценка вклада А. Н. Колмогорова в мировую науку. К 100-летию со дня рождения А. Н. Колмогорова открыт в БИОМЕТРИКЕ специальный раздел посвященный этому великому учёному России.



Андрей Николаевич Колмогоров.
2.04.1903  -  20.10.1987 


  Центр БИОСТАТИСТИКА
выполняет статистический анализ экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Нашими услугами пользуются аспиранты и докторанты по медицине, биологии, социологии, психологии и т.д. (См. далее )

Отзывы заказчиков по
статистическому анализу
данных


Примеры оформления заказчиками базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1,   Пример 2,   Пример 3


Поиск нужной информации на сайте БИОМЕТРИКА


www.biometrica.tomsk.ru

Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин.
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская. 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева.
ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев. 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко.
  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская
"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"


Сравниваем средние, а также и ...
В. Леонов

     Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. В статье объяснена большая ценность обнаружения не нормального распределения признака. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками. Что является важнейшим аргументом по формулировке списка проверки взаимосвязей важнейших признаков проводимого исследования.


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов. Мотивом к написанию данной статьи стал следующий инцидент. 11 апреля 2016 г. я получил вот какое письмо..


КУНСТКАМЕРА.

Обзор большой коллекции медицинских статей и диссертаций с существенными ошибками и нелепыми использованиями и описаниями методов статистики.


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине.

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.

Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.

Отзывы читателей обзора "Статистика в кардиологии. 15 лет спустя". В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...


Интересная ссылка


Логистическая регрессия в медицине и биологии.
Леонов В.

В серии 10 статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

Введение.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии.



Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Наши обучающие видеофильмы на YouTube

Камчатская фото-биометрика-2014. Фоторепортаж с семинара по биометрике в Петропавловске-Камчатском.

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском


Конференция по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению», (24 - 27 сентября 2015 года).

Балацкий Е.В. Диссертационная ловушка


После взрыва на СХК в 1993г. в Томске и Северске увеличилась частота рождения детей с пороками развития После того, или же вследствие того?
 Enyukov I.S. Data analysis, time series forecasting, Data Mining.

ПРИКЛАДНАЯ СТАТИСТИКА XXI ВЕКА.

Проблемы проверки статистических гипотез. Dr. Tseitlin tseitlin@gmx.net; фирма CuBe Matrix GbR, Гамбург, ФРГ, www.cubematrix.com


БИОМЕТРИКА + Музыка.

13 февраля 2014 г. Владимир Спиваков и "Виртуозы Москвы" дали концерт в Краснодаре. Я посетил этот прекрасный концерт, и вновь встретился с Владимиром Теодоровичем. Подарил ему его грампластики, фотографии, и свою книгу.

Музыка... Вот что сказал о ней великий Иоганн Себастьян Бах: "Цель музыки - трогать сердца". В детстве автор этих строк получил музыкальное образование. Любимыми инструментами были мандолина и гитара. Любимыми композиторами - Вивальди, Бах, Альбиони, Боккерини, Беллини, Корелли, Скарлатти. В 80-е годы прошлого столетия в Томск часто приезжал с концертами маэстро Владимир Спиваков. Эти концерты организовывал Егор Лигачёв, бывший в ту пору первым секретарём Томского обкома КПСС. На свой первый концерт в Томск Владимир Спиваков приехал один. Великолепно играл на скрипке! Концертный зал был переполнен слушателями, которые были в восторге от его концерта. Именно тогда мне удалось впервые встретиться с ним, и взять у него автографы на его грампластинки. В дальнейшем посещал все его концерты. В 1979 г. В. Спиваков организовал камерный оркестр "Виртуозы Москвы". Однажды в 90-е годы Владимир Спиваков должен был приехать в Томск с "Виртуозами Москвы", и в течение трёх дней дать 3 концерта. Однако из-за проблем с топливом в те времена, их самолёт посадили в Омске, где они пробыли 2 дня. И когда прилетели в Томск, то в один день провели все 3 концерта, которые я прослушал. И вновь взял автографы на новые грампластинки, и сделал много фотографий В. Спивакова.


Музыка...  Она помогает всегда. Вот почему я рассылаю всем нашис заказчикам файлы с хорошей музыкой. Любите музыку, слушайте её чаще. И она поможет лучше понимать бистатистику и результаты статистического анализа...

 Музыка для души ...


Конференция по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению», (24 - 27 сентября 2015 года).

Армянская ассоциация специалистов доказательной медицины

Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Камчатская фото-биометрика-2014. Фоторепортаж с семинара по биометрике в Петропавловске-Камчатском.

Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.


«Роющая деятельность кабана». Статья в "Независимой" газете...

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине.

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


ОТЗЫВ Шрамко Светланы Владимировны, доцента кафедры акушерства и гинекологии ДПО ГИУВ, г. Новокузнецк, о сотрудничестве с БИОМЕТРИКОЙ. "Выражаю огромную признательность и благодарность Леонову Василию Петровичу и его коллегам - коллективу центра БИОСТАТИСТИКА за эффективную и плодотворную работу. ... На мой взгляд, наиболее ценным является возможность обучения статистике, предлагаемый формат общения позволяет не только обсуждать полученные результаты, но и вместе с этим развиваться, расти диссертанту и в какой-то степени облагораживаться. Имея опыт написания кандидатской диссертации, поняла - как примитивны методы статистической обработки материала, которыми я владею, как мало я знаю!

ОТЗЫВ Арутюнян М.Р., врач-стоматолог, г. Саратов.

Здравствуйте, уважаемый Василий Петрович!  Хочу выразить огромную благодарность Вам и Вашим коллегам за высокий профессионализм, индивидуальный и внимательный подход и высокое качество исполнения своей работы! ... До сотрудничества с Василием Петровичем я пыталась самостоятельно разобраться в статистических методах анализа и прочитала не одно руководство. Но, чем больше я читала, тем больше осознавала, что ничего не понимаю. Все мои представления о статистической обработке данных заключались в расчёте средних показателей, стандартных отклонений и их сравнении. Я и представить себе не могла о существовании таких интересных методов анализа, как кластерный анализ, анализ таблиц сопряжённости, корреляционный анализ, логистическая регрессия!


Список научных и учебных изданий по биометрике и статистике

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях

Почему появилась эта статья
   За время существования сайта БИОМЕТРИКА его автору пришло довольно много писем, в которых читатели консультировались относительно различных нюансов использования и описания методов статистики в статьях и диссертациях. Этот поток писем периодически возрастал после публикаций статей автора на сопутствующие темы в "Бюллетене ВАК РФ",  "Международном журнале медицинской практики",  "Медицинской газете",  "Сибирском медицинском журнале", а также непосредственно на сайте БИОМЕТРИКА. С каждым годом таких писем становится все больше...

Леонов В.П. Общие проблемы применения статистики в биомедицине. 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Факторный анализ: основные положения и ошибки применения.

История биометрики

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2.ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины. Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В.


СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ 
ДЛЯ МЕДИКОВ И БИОЛОГОВ. 

(время и опыт)
. Леонов В.

Общие проблемы применения статистики в биомедицине,  или что разумнее: ДДПП или ДППД?

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.
Ошибка – это …
Ошибка или обман?

Обзоры ошибок применения статистики в медицине

Причины возникновения ошибок и меры борьбы с ними

Ошибки описания статистических методов

Меметический анализ описаний методов статистики

Локализация ошибочных описаний внутри научных школ

Мемы камуфляжных описаний

Смутно пишут о том, о чём смутно представляют

Коварный t-критерий Стьюдента

«… не зная законов языка ирокезского, можешь ли ты делать такое суждение  по  сему предмету…»

Что же делать, чтобы избежать ошибок?


КРАТКОСТЬ – СЕСТРА ТАЛАНТА?

 ИЛИ ПРИЗНАК НЕЗНАНИЯ?

 

Н.Бейли. МАТЕМАТИКА В БИОЛОГИИ И МЕДИЦИНЕ

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях

1997 - 2019.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"