|
Часть
учебно-методических материалов сайта, в том числе электронная библиотека, доступны только заказчикам работ по анализу данных для кандидатских и докторских диссертаций, а также слушателям системы дистанционного обучения и консультаций. Запрос на
выполнение анализа данных, обучение и консультации направляйте на мэйл |
Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
Отклики читателей статьи "Доказательная или сомнительная?"
Анализ журнальных публикаций и диссертаций по биомедицине обнаруживает, что в ряде случае авторы исследований используют критерий Колмогорова-Смирнова не совсем верно понимая специфику этого критерия. В итоге авторы трактуют полученные ими результаты ошибочно, искренне заблуждаясь в своих выводах. Известность научных организаций, в которых выполнялись эти исследования, ученые степени и звания авторов таких работ способствуют некритическому восприятию таких работ, и, как следствие, ошибочные выводы начинают далее самостоятельную, и подчас продолжительную, жизнь. Эти же причины способствуют и тому, что для неопытных исследователей эти работы становятся примерами для подражания, мемами, порождая тем самым дальнейшую цепь ошибочных выводов. К каким возможным отрицательным последствиям эти заблуждения могут привести в дальнейшем, очевидно проследить невозможно. "Нам не дано предугадать, как наше слово отзовется...". Наибольшее распространение среди таких исследователей получило следующее заблуждение, связанное с этим критерием. В том случае, когда распределение признака не подчиняется нормальному закону, авторы производят проверку гипотезы о равенстве двух генеральных средних с помощью критерия Колмогорова-Смирнова, считая его вполне адекватной заменой t-критерию Стьюдента для независимых выборок. Получив значение достигнутого уровня значимости "р" меньше 5% авторы трактуют этот результат только как неравенство двух генеральных средних.В немалой степени такая ситуация предопределена еще и доминирующей среди отечественных медиков и биологов статистической парадигмой, согласно которой основное различие опытной и контрольной групп заключается лишь в одном изменении такого параметра распределения, как среднее. Именно по этой причине примерно в 60% отечественных биомедицинских статей и диссертаций используют t-критерий Стьюдента для проверки подобной гипотезы, тогда как за рубежами России его используют всего лишь в 11% публикаций. Учитывая, что достаточно подробное описание
критерия критерия Колмогорова-Смирнова в отечественной литературе
встречается достаточно редко, приведем несколько цитат из ряда
изданий, после чего более подробно опишем специфику данного
критерия. 1. ВЕРОЯТНОСТЬ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. ЭНЦИКЛОПЕДИЯ.- М.: Научное издательство "Большая российская энциклопедия", 1999. Стр. 244-245. 2. ТАБЛИЦЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ. Большев Л.Н., Смирнов Н.В. - М.: Наука, Гл. ред. физ-мат. литературы, 1983 - 416с. Стр. 80-89, 350-352. 3. СПРАВОЧНИК ПО ПРИКЛАДНОЙ СТАТИСТИКЕ. Под ред. Э. Ллойда, У. Ледермана. Том. 2. Перевод с английского под редакцией С.А. Айвазяна и Ю. Тюрина. М.: Финансы и статистика, 1990. - 526 с. стр. 117-118. 4. Прежде чем привести описание интересующего нас критерия Колмогорова-Смирнова, обратим внимание на структуру данной монографии, которая считается одной из лучших по методам непараметрической статистики. Итак, приведем названия отдельных глав этой монографии: "Глава 3. Одновыборочная задача о положении (сдвиге)", "Глава 4. Двухвыборочная задача о положении (сдвиге)", "Глава 5. Двухвыборочная задача о рассеяниии (масштабе)", "Глава 10. Критерии, сконструированные для обнаружения произвольных альтернатив". Именно в этой, последней главе, и рассмотрен данный критерий. Обратите внимание на то, что в отличие от предыдущих глав, где речь идет о задачах проверки гипотез касающихся конкретных параметров распределений, таких, как мер положения (главы 3 и 4) и мер рассеяния (глава 5), в названии главы 10 говорится о произвольных альтернативах, т.е. не уточняется о каких конкретных параметрах будут рассмотрены статистические гипотезы. Кстати, аналогичная классификация использована и в книге "КОМПЬЮТЕРНАЯ БИОМЕТРИКА"/ Под ред. В.Н.Носова. - М.:Изд-во МГУ, 1990. - 232с. А теперь приведем несколько цитат из этой монографии, касающихся сути данного заблуждения. Стр. 232. "Эта глава посвящена свободным от
распределения критериям, предназначенным для обнаружения широких классов альтернатив.
В 10.1 приведено описание двухвыборочного свободного от распределения
критерия для гипотезы об идентичности двух совокупностей П1 и П2. Критерий предназначен для обнаружений
всех возможных отклонений от этой гипотезы." 5. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ. Лотар Закс (Пер. с нем. В.Н.Варыгина.) Под ред. Ю.П.Адлера, В.Г.Горского. - М.: Статистика, 1976. – 598 с.. стр. 268. 6. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. Ван дер Варден. М.: ИЛ, 1960, - 435c. Стр. 328. 7. STATISTICA: ИСКУССТВО ДАННЫХ НА КОМПЬЮТЕРЕ. ДЛЯ ПРОФЕССИОНАЛОВ. В.Боровиков.- СПб.: Питер, 2001. - 656с. Стр. 497. Итак, если подвести итог, то из этих и других приведенных в литературе (ОСНОВНЫЕ ТАБЛИЦЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ. Ликеш И., Ляга Й. Пер. с чешского. М.: Финансы и статистика. 1985. - 356с. КОМПЬЮТЕРНАЯ БИОМЕТРИКА/Под ред. В.Н.Носова. - М.:Изд-во МГУ, 1990. - 232с. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ И ПРОВЕРКА ГИПОТЕЗ НА ЭВМ. Петрович М.Л., Давидович М.И., М.: Финансы и статистика, 1989. - 191с. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. П. Бикел, К. Доксам./Пер. с англ. Ю.А, Данилова Вып. 2. - , М.: Финансы и статистика, 1983. - 254с. и др.)описаний двухвыборочного критерия Смирнова (он же критерий Колмогорова-Смирнова), становится ясно, что нулевая гипотеза однородности говорит об идентичности двух функций распределения. Принятие этой гипотезы автоматически означает и равенство всех соответствующих параметров этих распределений. Однако отклонение нулевой гипотезы и принятие альтернативной гипотезы не отвечает на вопрос о том, какие именно параметры не равны в сравниваемых распределениях. Об этом же, вторя Ван дер Вардену и В.Боровикову, говорят и авторы популярной среди медиков и биологов книги "ПРИМЕНЕНИЕ НЕПАРАМЕТРИЧЕСКИХ КРИТЕРИЕВ СТАТИСТИКИ В МЕДИКОБИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ" Гублер Е.В. и Генкин А.А. (Ленинград, изд-во "Медицина", Ленинградское отделение. 1973, 142с.). В данной книге нет описания критерия Колмогорова-Смирнова, но в Предисловии (стр. 6) авторы говорят следующее. "Следует отметить, что применение непараметрических критериев статистики в медицине и биологии, несомненно, заслуживает более фундаментального изложения чем в предлагаемом издании. Представляет интерес более подробное изложение общих принципов непараметрической статистики, рассмотрение ряда непараметрических критериев различий (критерия Колмогорова-Смирнова, критерия Ван дер Варден и др." Итак, вот что пишут Гублер Е.В. и Генкин А.А. в своей книге. Стр. 16. Итак, при использовании двухвыборочного критерия Колмогорова-Смирнова отклонение нулевой гипотезы об идентичности двух распределений и принятие гипотезы различия двух распределений не позволяет утверждать, что это различие наблюдается именно для средних. С таким же успехом данное различие может наблюдаться и для других параметров распределения, тогда как средние в этом случае могут быть равными. Сама статистика Смирнова построена таким образом, что в ней игнорируются конкретные параметры распределений (средние, дисперсии и т.д.) Рассматриваются только функции распределения без конкретных параметров. Проиллюстрируем сказанное выше графически. Для этого сгенерируем в пакете EXCEL две выборки данных, подчиняющиеся нормальному закону распределения. Объем каждой из выборок зададим равным 100. При этом генеральные средние (математические ожидания) зададим в обеих выборках равными 4, а значения генеральных стандартных отклонений (стандартов) отличающимися в три раза: в одном массиве равном 1, а в другом - 3. Выборочные значения средних и стандартов, естественно, будут несколько отличаться, в силу ограниченности выборок, от заданных теоретических величин. Так выборочные средние будут равны 3,959600 и 3,828200, а выборочные стандарты, соответственно, 1,085417 и 3,001538. Далее эти две выборки объединим в один массив DATA1.STA объемом 200 наблюдений, с группирующим признаком имеющим две градации: 1-я и 2-я группа. Используем этот тестовый набор данных DATA1.STA и построим совмещенные гистограммы распределения накопленной частоты. Данные гистограммы представлены ниже.
Поскольку наши выборки изначально были сгенерированы с использованием нормального закона распределения, то видно, что эмпирические (фактические) функции распределения весьма близки к теоретическим. Далее мы покажем крупным планом один участок этого графика, в том интервале значений переменной Х, для которого разница между двумя эмпирическими функциями распределения максимальна. Вертикальные отрезки со стрелками представляют собой те разности двух эмпирических функций, которые претендуют на максимальное значение, и одна из них, самая большая, будет использована в качестве статистики Смирнова Dn1,n2 = sup|Fn1(z)- Gn2(z)|. На следующем графике представлено распределение разностей сравниваемых эмпирических функций распределения F1 и F2, в зависимости от значения Х. Стрелками обозначены максимальные положительная и отрицательная разность. График построен с использованием программы разработанной профессором кафедры прикладной информатики ТГУ д.ф.-м.н. В.В.Поддубным.
Рассмотренные выше особенности статистических критериев проиллюстрируем также с помощью аналогичным образом синтезированного массива данных DATA2.STA . В данном массиве имеются две группы наблюдений, в каждой из которых по 100 наблюдений. Количественный признак представлен переменной VAR1, группирующий признак - VAR2. Вторая группа была сконструирована из первой группы наблюдений специальным образом. В частности, после сортировки признака VAR1 в первой выборке по возрастанию, к первым 50 наблюдениям прибавили одно и то же число, тогда как от следующих 50 наблюдений это же самое число вычли. Полученные при этом новые значения признака VAR1 и составили вторую группу. В результате этой операции обе группы имеют идентичные средние (9,965234) и равные суммы значений (996,5234) переменной VAR1 в каждой из этих групп. Отличие же заключается в том, что первая группа имеет нормальное распределение с унимодальной гистограммой, тогда как вторая группа имеет ярко выраженное антимодальное распределение (провал в центре и по одной моде слева и справа) . Гистограммы распределения этих групп приведены ниже.
Проведем сравнение этих групп используя
непараметрические статистики. Тест Вальда-Вольфовица указывает на
статистически значимое различие двух распределений (см. ниже).
О таком же различии говорят и результаты применения
теста Колмогорова-Смирнова в пакете S-PLUS 2000 (см. ниже). ***
Summary Statistics for data in: DATA2.SAV ***
С целью исключения подобных ошибочных выводов в большинстве зарубежных биомедицинских журналов все поступающие статьи проходят рецензирование на предмет корректности статистических выводов исследований. Для иллюстрации этого утверждения приведем некоторые выдержки из книги Стентона Гланца "Медико-биологическая статистика" (М.: Практика, 1998. - 459с.). "Важность грамотного использования статистических методов осознается все шире. И, хотя ошибки не исчезли, все больше журналов прилагают усилия к их искоренению. Во многих из них рецензирование включает отдельный этап проверки статистической правильности предлагаемых работ. Приведу подтверждение, наиболее ощутимое для меня. Я являюсь внештатным редактором Journal of the American College of Cardiology, и моя работа состоит в выявлении статистических ошибок в поступающих работах. Доля статей, содержащих ошибки, составляет около половины, но теперь уже половины предлагаемых к публикации, а не опубликованных работ.." (стр. 16) "Поиск новых методов диагностики и лечения, выбор наилучшего из уже принятых - везде статистические соображения играют не последнюю роль. Чтобы принять полноправное участие в обсуждении этих вопрососв, врач должен быть знаком с принципами и основными методами статистики. До сих пор медики редко участвовали в обсуждении статистических вопросов, на первый взгляд далеких от врачебной практики и носящих сугубо технический характер. Однако по мере ужесточения требований к использованию ресурсов медикам следует научиться проверять обоснованность претензий на эффективность и с большим пониманием участвовать в распределении средств. И основой для этого служит статистика." (стр. 20) "Как мы видим, статистические ошибки встречаются примерно в половине статей. Однако дальнейшие исследования показали, что журналам, в которых взяли за правило обращать внимание не только на медицинскую, но и статистическую сторону дела, удалось существенно снизить долю ошибочных статей. Эта доля нимало не изменилась в тех журналах, которые так и не ввели статистического рецензирования. Врачам известно множество методов диагностики и лечения, эффективность которых была "доказана" статистическими методами и которые тем не менее канули в Лету, не выдержав проверки практикой. А сколь часто приходится читать статьи, в которых статистические манипуляции с одними и теми же данными приводят к прямо противоположным выводам. Все это наводит читателя на мысль, что статистические методы либо ненадежны, либо слишком трудны для понимания, либо вообще не более чем инструмент для недобросовестного исследователя. Между тем даже начального знакомства со статистикой в сочетании со здравым смыслом обычно достаточно, чтобы понять, что предлагает нам автор в качестве "доказательств". По иронии судьбы ошибки редко связаны с тонкими статистическими вопросами. Как правило, это простейшие ошибки, такие как отсутствие контрольной группы, использование неслучайных выборок или пренебрежение статистической проверкой гипотез. По неизвестным науке причинам такие ошибки неизменно смещают результаты исследования в пользу предлагаемого автором метода (Выделено нами. В.Л.). Вред наносимый ошибками такого рода, очевиден. Исследователь заявляет о "статистически достоверном" эффекте лечения, редактор помещает статью в журнал, врач, неспособный критически оценить публикацию, применяет неэффективный метод лечения. В конце этой цепи находится больной, который и расплачивается за все, подвергаясь ненужному риску и не получая действительно эффективного лечения (Выделено нами. В.Л.). Не следует сбрасывать со счетов и ущерб от самого факта проведения бессмысленных исследований. Деньги и подопытные животные приносятся в жертву науке, больные рискуют ради сбора ошибочно интерпретируемых данных. Сегодня грамотная проверка эффективности лечения становится первоочередной задачей. Исследования должны тщательно планироваться, а результаты правильно интерпретироваться. ОШИБКИ ВЕЧНЫ? Журналы призваны быть оплотом качества научных исследований. В некоторых редакциях действительно осознали, что их рецензенты не слишком сведущи в использовании элементарной статистики, и изменили саму процедуру рецензирования. Теперь, перед тем как направить рукопись на рецензию, ее тщательно проверяют на предмет правильности использования статистических методов. Результатом этого нередко становится пересмотр используемых в статье статистических методов, а иногда и самих выводов. Но большинство редакторов, похоже,
убеждены, что каждый рецензент рассматривает статистическую сторону
работы столь же тщательно, сколь и собственно медицинскую. Неясно, однако, как он может это сделать - ведь даже
авторы ведущих медицинских журналов, упоминая статистичекую проверку
гипотез, редко затрудняют себя указанием, какой именно критерий был
использован. Коротко говоря, для
грамотного чтения медицинской литературы необходимо научиться понимать и
оценивать правильность применения статистических методов, используемых
для анализа результатов." (стр. 23-25). Естественно, обсуждаемые выше проблемы взаимодействия "Автор-Редакция-Читатель" не ограничиваются только статистическими аспектами публикуемых статей. Однако этот аспект наиболее тесно связан с надежностью и достоверностью авторских выводов. Известнейший журнал British Medical Journal (BMJ) в своих требованиях к рукописям статей, предлагаемых к публикации, прямо говорит о том, что редакция журнала в сомнительных случаях вправе требовать от авторов предоставления исходных данных для перепроверки выводов. Будем надеяться, что в скором времени аналогичные требования станут нормой в диссертационных советах и редакциях отечественных биомедицинских журналах, что повысит качество публикаций. В 1940 г. академик А.Н.Колмогоров опубликовал в Докладах Академии Наук СССР (1940. Том ХХVII. № 1.) статью "ОБ ОДНОМ НОВОМ ПОДТВЕРЖДЕНИИ ЗАКОНОВ МЕНДЕЛЯ". В этой статье, на основе данных Н.И. Ермолаевой (аспирантки академика Т.Д. Лысенко), Андрей Николаевич убедительно опроверг ложные выводы Н.И. Ермолаевой о том, что законы Менделя не верны. Именно эта статья и побудила нас открыть раздел КУНСТКАМЕРА. Однако доказать ложность выводов Н.И. Ермолаевой А.Н.Колмогоров смог только потому, что будучи абсолютно уверена в истинности своих выводов, она привела в своей статье все свои исходные данные. Полагаю, что и в наше время тем исследователям, которые также уверены в истинности своих результатов, имеет смысл предоставлять свободный доступ к тем данным, на основе которых получены публикуемые результаты. © 2001. В.Леонов. Хотите скачать книги по биостатистике? Читайте информацию на первой странице нашего сайта :-) |
СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее) Отзывы заказчиков по статистическому анализу данных Дистантное обучение биостатистике с помощью IP-телефонии. Информация о специализированных курсах и семинарах по прикладной биостатистике для студентов, аспирантов, докторантов и научных сотрудников НИИ и вузов работающих в области биологии, медицины, социологии, психологии и т.д. (См. далее) |
|||||||||||||||||||||||||||||
1998 - 2011.© Василий
Леонов. E-mail:
Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
Отклики читателей статьи "Доказательная или сомнительная?"
Т. Кун "Структура научных революций"