Бюллетень ВАК N5 1997 г. ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ.
Каждый слышит то, что понимает. Гете

Часть учебно-методических материалов сайта, в том числе электронная библиотека, доступны только заказчикам работ по анализу данных для кандидатских и докторских диссертаций, а также слушателям системы дистанционного обучения и консультаций. Запрос на выполнение анализа данных, обучение и консультации направляйте на мэйл E-Mail редактора БИОМЕТРИКИ

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Обращение межрегионального Общества специалистов доказательной медицины в ВАК РФ

Дисперсия жизни...
;Регистрационный код (если есть) 
; Открывать в новом окне?  ;Имя нового окна 
; Разрешение (1-8)  ; Скорость смены (1-255)  ; Задержка (миллисекунд)  ; Смена рисунков со спецэффектами ("YES" или "NO")  ;Произвольный рисунок поверх апплета  ;X смещение наложенного рисунка  ;Y смещение наложенного рисунка  ;Задержка освобождения памяти  ;Приоритет задачи (1..10)  ; Мин. время синхр. кадра (мс); Sorry, your browser doesn't support Java ; Сообщение для браузеров без поддержки Java (tm) 

Кликните по фотографии,
и вы сможете ...

 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ.
В.П.Леонов - доцент факультета информатики Томского государственного университета;
П.В.Ижевский - ученый секретарь диссертационного совета Государственного научного центра Российской Федерации. Институт биофизики
.

Анализ достаточно большого количества отечественных диссертаций и журнальных публикаций по медико-биологической тематике за последние годы показывает явное неблагополучие с применением в них статистических методов. Проблема представляется нам весьма актуальной и важной для повышения качества подготавливаемых в настоящее время диссертационных работ в области биологии и медицины. Кратко ее можно сформулировать так: не отвечающий современным возможностям уровень использования прикладной статистики в медицинской и биологической науке. Отметим, что в свое время эта же проблема стояла и в зарубежной медицинской и биологической науке. Так, по данным [1] установлено, что наиболее популярный тест на достоверность различий средних (t- критерий Стьюдента) применялся с ошибками в 51 случае из 72. Общая же частота ошибок в использовании статистических методов в статьях, посвященных анализу биомедицинских наблюдений, составляла от 44 до 78% (по данным того же источника). Аналогичные результаты приводятся и в других источниках [2]. Однако эти данные отражают состояние 15-летней давности. С тех пор, судя по современным публикациям, произошли существенные изменения и уровень использования прикладной статистики в зарубежной медицинской и биологической науке стал достаточно высок. Это объясняет несколькими причинами: более ранним и широким применением информатики в медико-биологических научных исследованиях, более глубоким статистическим образованием научных кадров и наличием специализированных подразделений, профессионально выполняющих статистическую обработку результатов наблюдений.  Тем самым задается более высокий уровень требований к подготовке научных кадров. Поэтому не будет большим преувеличением утверждение, что язык статистики становится таким же международным языком ученых, имеющих дело с анализом биомедицинских наблюдений, как и английский язык в целом в научных средах.

Кроме вышесказанного, проблема применения прикладной статистики в отечественной медицине имеет не только чисто научный, но и большой моральный аспект. Это связано в тем, что решения о применении новых лекарственных препаратов и методик лечения больных опираются на выводы, полученные с помощью статистического анализа большого количества наблюдений. Эти же решения, в свою очередь, непосредственно отражаются уже на здоровье населения страны. Очевидно, сколь ответственно и педантично в этом случае должен быть использован аппарат статистики.О большом потенциале информатики и статистики в медицине и биологии можно судить по работам таких известных авторов, как Автандилов Г.Г., Баевский Р.М., Гублер Е.В., Петров Р.И., Марчук Г.И., Максимов Г.К., Хаитов Р.М. и т.д. Однако в России для большинства исследователей в области медицины и биологии, статистика про- должает оставаться некой “terra incognita”.

Нередко применение статистики в диссертациях и статьях, подготовленных по медико-биологическим специальностям, является не более чем средством “онаучивания” утверждений автора и попыткой придать работе более солидный и весомый вид. Проведенный нами анализ более 200 диссертаций на соискание ученых степеней кандидата и доктора медицинских (биологических) наук, а также анализ публикаций 10 наиболее известных биомедицинских журналов (“Кардиология”, “Радиационная биология. Радиоэкология”, “Медицинская радиология”, “Иммунология” и т.д.) за последние 3 года показал, что в 30 - 40% работ используется только t-критерий Стьюдента, предложенный английским химиком У.Госсетом в 1908 году. Анализ этих работ показывает, что в половине случаев использование t-критерия Стьюдента неправомочно, а стало быть и полученные при этом выводы могут быть ложными. Известно, что первые статьи с применением t-криерия Стьюдента в основных медико-биологических журналах стали появляться в начале 60-х годов. С тех пор большинство авторов ограничиваются в своих работах использованием среднего значения и ошибки среднего в виде М ± m и t-критерием Стьюдента. Более чем в половине проанализирован- ных работ вообще не конкретизируется с помощью каких статистических критериев были получены декларируемые авторами статистические гипотезы. Как правило, в таких работах упоминание об использованных авторами статистических методах дается в виде, хорошо иллюстрирующем известное высказывание М.В.Ломоносова “Смутно пишут о том, о чем смутно представляют”. Чаще всего встречаются фразы:

1. Результаты обработаны статистически;
2. Результаты обработаны стандартными методами статистики;
3. Результаты обработаны методом вариационной статистики, и тому подобные.

Практически лишь в единичных работах можно встретить упоминание о таких современных методах статистики (широко применяемых в других научных направлениях), как множественная регрессия, кластерный и дискриминантный анализ, факторный анализ и анализ главных компонент и т.д. Достаточно редко используется и такой известный метод, как дисперсионный анализ (которому уже более 60 лет!). Крайне редко используются методы теории планирования экспериментов, которые позволяют минимизировать число наблюдений и увеличить количество извлекаемой при этом информации. В ряде проанализированных нами диссертаций встречаются столь грубые нарушения основных предпосылок использованных статистических методов, что выводы этих работ становятся бессмысленными. Например, используется множественная регрессия с качественными предикторными (независимыми) переменными, вычисляется парный коэффициент корреляции Пирсона без исключения явно аномальных наблюдений или производится сравнение двух средних с помощью t-критерия Стьюдента для признаков, не подчиняющихся нормальному распределению, для случая неравных генеральных дисперсий либо для ранговых (балльных) признаков и т.д. В таблице 1 даны основные результаты выполненного нами анализа.

Таблица 1

Относительная частота использования методов статистического анализа

Форма представления результатов и используемые методы анализа и критерии

выражение М ± m выражение p < стат. критерий
не указан
t - критерий Стьюдента корреля-ционный анализ

критерий Хи-квадрат Пирсона

прочие методы статистика не применялась вообще
Частота относительная, % 79 62 64 33 7 6 10 20
 
 
Отметим, что в анализ не включались диссертации, в которых не использовался выборочный метод анализа наблюдений, а также обзорные статьи и статьи, имеющие лекционный характер.
 
Подобные же выводы делают и авторы статьи [3], в которой сообщены результаты наукометрического анализа публикаций журналов “ECOLOGY” и “ЭКОЛОГИЯ”, основанного на данных об индивидуальной и совместной частоте встречаемости в этих публикациях экологических и математических терминов. Авторы делают вывод о том, что существенно различаются по степени математизации англоязычные и русскоязычные статьи. Для иллюстрации этого утверждения мы приводим ниже одну из таблиц работы [3]. Как видно из таблицы 2, обращает на себя внимание значительное различие в частоте применения многомерных и непараметрических методов статистики в статьях сравниваемых журналов.

Таблица 2

Доля публикаций, использующих разные группы математических методов
( в % от числа статей из данного журнала)

Математические методы Журнал“ECOLOGY” Журнал“ЭКОЛОГИЯ”
Описательные и обзорные сообщения без статистических данных 4 24
Стандартные методы 77 69
Многомерные методы 60 13
Непараметрические методы 35 0
Категоризованные данные 15 0
Марковские процессы 2 0
Дифференциальные уравнения 2 0
 
По мере усложнения решаемых задач недостаток применения многомерных и непараметрических методов статистики перестает быть чисто “технологическим” и приобретает методологические черты. Между тем, в проанализированных нами диссертациях и статьях упоминаются персональные компьютеры, использованные для проведения статистической обработки данных, и современные статистические программы. На этом основании можно утверждать, что данная неблагополучная ситуация обусловлена не слабой материально-технической базой, а общим состоянием методологии анализа медико-биологических наблюдений. Уровень применения статистики в отечественной биологии и медицине можно проиллюстрировать следующим фактом. Так, 26 - 29 августа 1996 г. в Будапеште проходила ХVII конференция ISCB - международного общества клинической биостатистики. Из 15 членов исполнительного и научного комитетов этого общества нет ни одного представителя ни России, ни других республик бывшего СССР! Отсутствуют они и среди докладчиков пленарных заседаний и сателлитных минисимпозиумов. Отметим, что согласно информации Президента ISCB Dr.Karsten Schmidt, национальные отделения ISCB уже имеются в Польше и Венгрии.
 
 
На наш взгляд, имеется несколько основных причин создавшегося положения.
 
 
Первая причина имеет достаточно сильную связь с доминировавшей ранее идеологией, которая игнорировала статистику как науку, позволяющую принимать оптимальные решения в условиях недостатка информации (определение статистика А.Вальда).
 
 
Вторая причина заключается в существующей концепции преподавания математики. Если с понятием функции, как детерминированной зависимости, наши школьники знакомятся еще в начальных классах, то статистические зависимости вообще остаются за рамками учебных программ. Для сравнения можно сослаться на опыт развитых стран, в которых данный раздел математики начинают изучать еще в школе. Например, в Японии с 1972 г. знакомство с основными понятиями теории вероятностей и математической статистики введено, начиная уже со второго класса, т.е. с семилетнего возраста [4]. А на 7 - 9 годах школьного обучения детям прививают навыки построения гистограмм, корреляционных таблиц и диаграмм и т.д.
 
Положение с преподаванием статистики в наших медицинских вузах, на наш взгляд, просто вопиющее. Поскольку вузы готовят врачей, а не ученых-медиков, то в силу этого вуз не может дать глубокую подготовку в области прикладной статистики. Подготовка же в этой области на этапе аспирантуры явно недостаточна. Более того, в ряде институтов, имеющих аспирантуру по данным направлениям, аспиранты не проходят подготовку по основам информатики и вычислительной техники.
 
 
Третья причина - отсутствие действующей нормативной базы, регламентирующей как саму систему анализа экспериментальных данных, так и формы представления результатов статистического анализа наблюдений в научных публикациях. Достаточно подробно этот аспект рассмотрен в статье профессора А.И.Орлова [5]. За рубежом в этой части уже наблюдаются позитивные изменения. Так, более 300 зарубежных журналов придерживаются “Единых требований к рукописям, представляемым в биомедицинские журналы” (так называемый стиль Ванкуверской группы, 1978 г.). Позже Ванкуверская группа была преобразована в Международный комитет редакторов медицинских журналов - WAME, который ставит своей целью повышение качества публикаций.  Последняя редакция “Единых требований...” от 1988 г. уже содержит ряд требований по описанию используемых авторами методов статистики.
 
 
Формированию такого состояния способствует и сама специфика медико-биологической диссертационной тематики. Мы имеем в виду то, что для многих научных направлений истинность выводов диссертационных работ достаточно надежно проверяема. Это относится как к специальностям физико-математического профиля, так и к техническим специальностям. Однако для большинства медико-биологических диссертационных работ, основные выводы которых апеллируют к результатам статистического анализа выборочных наблюдений, проверка истинности этих выводов довольно затруднительна, а во многих случаях и невозможна. Это объясняется тем, что массив экспериментальных данных, на основе которого автор получил представляемые на защиту положения и выводы, оказывается доступным только самому диссертанту, поскольку матрица первичных данных не приводится в виде “Приложения” к диссертации. В результате не только статистическая проверка выводов диссертации в настоящее время, но и реанализ данных в будущем, в случае появления новых, более мощных статистических методов обработки и программных продуктов, становиться невозможным.
 
 
 
Немаловажным фактором является и то, каким образом в настоящее время производится статистическая обработка в ходе подготовки диссертаций. В большинстве случаев диссертанты вынуждены самостоятельно выполнять данный этап исследования, зачастую недостаточно квалифицированно, вследствие чего получаемые при этом выводы часто сомнительны, либо ложны. Лишь в нескольких наиболее крупных НИИ имеются специализированные подразделения, подобные отделу биостатистики Всероссийского научно-исследовательского центра профилактической медицины РАМН. Нередко в крупных НИИ РАМН, где количество современных персональных компьютеров от 50 и более, число сантехников или электриков значительно превосходит численность специалистов в области информатики.
 
Успешной защите медико-биологических диссертаций, содержащих сомнительные или заведомо ложные статитические методы, способствует также и отсутствие специалистов по прикладной статистике в составе диссертационных советов по медико-биологическим специальностям. Зачастую в отзывах о научно-практической значимости и отзывах оппонентов вообще не рассматриваются эти аспекты выполненного исследования. Особенно характерно такое положение для провинциальных НИИ и вузов.

Список цитируемых источников.
 
1. Hall J.C. Use of t-test in the British Journal of Surgery // Brit.J.Surg. - 1982. - Vol.69. - N 1. - P. 55 - 57.
2. Friedman S.B., Phillips S. What's the difference? // Pediatrics. - 1981. Vol.68, N 5. - P. 644 - 646.
3. Будилова Е.В., Дрогалина Ж.А., Терехин А.Т. Основные направления современной экологии и ее математический аппарат: анализ публикаций. // Журнал общей биологии. - 1995. - Т.56. - № 2. с. 179 - 189.
4. Степенко Г.В. О преподавании теории вероятностей и математической статистики в школах Японии. Киев, Институт математики АН УССР. 1976, с. 23.
5. Орлов А.И. О современных проблемах внедрения прикладной статистики и других статистических методов. // Журнал “Заводская лаборатория”. 1991. № 1. - с. 67 - 74.

От редакции
 
Публикуемая статья, по мнению редакции, поднимает важную методологическую проблему, выходящую за рамки медицинской и биологической науки. По рассмотренным в статье вопросам могут быть и иные мнения. Редакция приглашает специалистов к дискуссии.
СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

Отзывы заказчиков по статистическому анализу данных

Дистантное обучение биостатистике с помощью IP-телефонии. Информация о специализированных курсах и семинарах по прикладной биостатистике для студентов, аспирантов, докторантов и научных сотрудников НИИ и вузов работающих в области биологии, медицины, социологии, психологии и т.д. (См. далее)

Отзывы по дистантному обучению статистике

 


1998 - 2011.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"