|
Дисперсия жизни...
Кликните по фотографии,
и вы сможете ... |
ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ.
В.П.Леонов - доцент факультета информатики Томского государственного университета;
П.В.Ижевский - ученый секретарь диссертационного совета Государственного научного центра Российской Федерации. Институт биофизики.
|
Анализ достаточно большого количества отечественных
диссертаций и журнальных публикаций по медико-биологической тематике за
последние годы показывает явное неблагополучие с применением в них
статистических методов. Проблема представляется нам весьма актуальной и
важной для повышения качества подготавливаемых в настоящее время
диссертационных работ в области биологии и медицины. Кратко ее можно
сформулировать так: не отвечающий современным возможностям уровень
использования прикладной статистики в медицинской и биологической
науке. Отметим, что в свое время эта же проблема стояла и в зарубежной
медицинской и биологической науке. Так, по данным [1] установлено, что
наиболее популярный тест на достоверность различий средних (t-
критерий Стьюдента) применялся с ошибками в 51 случае из 72. Общая же
частота ошибок в использовании статистических методов в статьях,
посвященных анализу биомедицинских наблюдений, составляла от 44 до 78%
(по данным того же источника). Аналогичные результаты приводятся и в
других источниках [2]. Однако эти данные отражают состояние 15-летней
давности. С тех пор, судя по современным публикациям, произошли
существенные изменения и уровень использования прикладной статистики в
зарубежной медицинской и биологической науке стал достаточно высок. Это
объясняет несколькими причинами: более ранним и широким применением
информатики в медико-биологических научных исследованиях, более
глубоким статистическим образованием научных кадров и наличием
специализированных подразделений, профессионально выполняющих
статистическую обработку результатов наблюдений. Тем самым задается более высокий уровень
требований к подготовке научных кадров. Поэтому не будет большим
преувеличением утверждение, что язык статистики становится таким же
международным языком ученых, имеющих дело с анализом биомедицинских
наблюдений, как и английский язык в целом в научных средах.
Кроме вышесказанного, проблема применения прикладной
статистики в отечественной медицине имеет не только чисто научный, но и
большой моральный аспект. Это связано в тем, что решения о применении
новых лекарственных препаратов и методик лечения больных опираются на
выводы, полученные с помощью статистического анализа большого
количества наблюдений. Эти же решения, в свою очередь, непосредственно
отражаются уже на здоровье населения страны. Очевидно, сколь
ответственно и педантично в этом случае должен быть использован аппарат
статистики.О большом потенциале информатики и статистики в медицине и
биологии можно судить по работам таких известных авторов, как
Автандилов Г.Г., Баевский Р.М., Гублер Е.В., Петров Р.И., Марчук Г.И.,
Максимов Г.К., Хаитов Р.М. и т.д. Однако в России для большинства
исследователей в области медицины и биологии, статистика про-
должает оставаться некой “terra incognita”.
Нередко применение
статистики в диссертациях и статьях, подготовленных по
медико-биологическим специальностям, является не более чем средством
“онаучивания” утверждений автора и попыткой придать работе более
солидный и весомый вид. Проведенный нами анализ более 200 диссертаций на соискание
ученых степеней кандидата и доктора медицинских (биологических) наук, а
также анализ публикаций 10 наиболее известных биомедицинских журналов
(“Кардиология”, “Радиационная биология. Радиоэкология”, “Медицинская
радиология”, “Иммунология” и т.д.) за последние 3 года показал, что в
30 - 40% работ используется только t-критерий Стьюдента, предложенный
английским химиком У.Госсетом в 1908 году. Анализ этих работ
показывает, что в половине случаев использование t-критерия Стьюдента
неправомочно, а стало быть и полученные при этом выводы могут быть
ложными. Известно, что первые статьи с применением t-криерия Стьюдента
в основных медико-биологических журналах стали появляться в начале 60-х
годов. С тех пор большинство авторов ограничиваются в своих работах
использованием среднего значения и ошибки среднего в виде М ± m и t-критерием Стьюдента. Более чем в половине проанализирован-
ных работ вообще не конкретизируется с помощью каких статистических
критериев были получены декларируемые авторами статистические гипотезы.
Как правило, в таких работах упоминание об использованных авторами
статистических методах дается в виде, хорошо иллюстрирующем известное
высказывание М.В.Ломоносова “Смутно пишут о том, о чем смутно
представляют”. Чаще всего встречаются фразы:
- 1. Результаты обработаны статистически;
- 2. Результаты обработаны стандартными методами статистики;
- 3. Результаты обработаны методом вариационной статистики,
и тому подобные.
Практически лишь в единичных работах можно встретить
упоминание о таких современных методах статистики (широко применяемых в
других научных направлениях), как множественная регрессия, кластерный и
дискриминантный анализ, факторный анализ и анализ главных компонент и
т.д. Достаточно редко используется и такой известный метод, как
дисперсионный анализ (которому уже более 60 лет!). Крайне редко
используются методы теории планирования экспериментов, которые
позволяют минимизировать число наблюдений и увеличить количество
извлекаемой при этом информации. В ряде проанализированных нами
диссертаций встречаются столь грубые нарушения основных предпосылок
использованных статистических методов, что выводы этих работ становятся
бессмысленными. Например, используется множественная регрессия с
качественными предикторными (независимыми) переменными, вычисляется
парный коэффициент корреляции Пирсона без исключения явно аномальных
наблюдений или производится сравнение двух средних с помощью t-критерия
Стьюдента для признаков, не подчиняющихся нормальному распределению,
для случая неравных генеральных дисперсий либо для ранговых (балльных)
признаков и т.д. В таблице 1 даны основные результаты выполненного нами
анализа.
-
Таблица 1
-
Относительная частота использования методов статистического анализа
| Форма представления результатов и используемые методы анализа и критерии |
|
выражение М ± m |
выражение p < |
стат. критерий
не указан |
t - критерий Стьюдента |
корреля-ционный
анализ |
критерий Хи-квадрат Пирсона |
прочие методы |
статистика не применялась вообще |
| Частота относительная, % |
79 |
62 |
64 |
33 |
7 |
6 |
10 |
20 |
-
-
- Отметим, что в анализ не включались диссертации, в которых не
использовался выборочный метод анализа наблюдений, а также обзорные
статьи и статьи, имеющие лекционный характер.
-
- Подобные же выводы делают и авторы статьи [3], в которой сообщены результаты наукометрического анализа
публикаций журналов “ECOLOGY” и “ЭКОЛОГИЯ”, основанного на данных об индивидуальной и совместной
частоте встречаемости в этих публикациях экологических и математических терминов. Авторы делают вывод о
том, что существенно различаются по степени математизации англоязычные и русскоязычные статьи. Для иллюстрации этого утверждения мы приводим ниже одну из таблиц работы [3]. Как видно из таблицы 2, обращает на себя
внимание значительное различие в частоте применения многомерных и непараметрических методов статистики в
статьях сравниваемых журналов.
-
Таблица 2
Доля публикаций, использующих разные группы математических методов
( в % от числа статей из данного журнала)
| Математические методы |
Журнал“ECOLOGY” |
Журнал“ЭКОЛОГИЯ” |
| Описательные и обзорные сообщения без статистических данных |
4 |
24 |
| Стандартные методы |
77 |
69 |
| Многомерные методы |
60 |
13 |
| Непараметрические методы |
35 |
0 |
| Категоризованные данные |
15 |
0 |
| Марковские процессы |
2 |
0 |
| Дифференциальные уравнения |
2 |
0 |
-
- По мере усложнения решаемых задач недостаток применения
многомерных и непараметрических методов статистики перестает быть чисто
“технологическим” и приобретает методологические черты. Между тем, в проанализированных нами диссертациях и статьях упоминаются
персональные компьютеры, использованные для проведения статистической
обработки данных, и современные статистические программы. На этом
основании можно утверждать, что данная неблагополучная ситуация
обусловлена не слабой материально-технической базой, а общим состоянием
методологии анализа медико-биологических наблюдений. Уровень применения
статистики в отечественной биологии и медицине можно проиллюстрировать
следующим фактом. Так, 26 - 29 августа 1996 г. в Будапеште проходила
ХVII конференция ISCB - международного общества клинической
биостатистики. Из 15 членов исполнительного и научного комитетов этого
общества нет ни одного представителя ни России, ни других республик
бывшего СССР! Отсутствуют они и среди докладчиков пленарных заседаний и
сателлитных минисимпозиумов. Отметим, что согласно информации
Президента ISCB Dr.Karsten Schmidt, национальные отделения ISCB уже
имеются в Польше и Венгрии.
-
-
- На наш взгляд, имеется несколько основных причин создавшегося положения.
-
-
- Первая причина имеет достаточно сильную связь с доминировавшей ранее идеологией, которая игнорировала
статистику как науку, позволяющую принимать оптимальные решения в условиях недостатка информации
(определение статистика А.Вальда).
-
-
- Вторая причина заключается в существующей концепции
преподавания математики. Если с понятием функции, как детерминированной
зависимости, наши школьники знакомятся еще в начальных классах, то
статистические зависимости вообще остаются за рамками учебных программ.
Для сравнения можно сослаться на опыт развитых стран, в которых данный
раздел математики начинают изучать еще в школе. Например, в Японии с
1972 г. знакомство с основными понятиями теории вероятностей и
математической статистики введено, начиная уже со второго класса, т.е.
с семилетнего возраста [4]. А на 7 - 9 годах школьного обучения детям
прививают навыки построения гистограмм, корреляционных таблиц и
диаграмм и т.д.
-
- Положение с преподаванием статистики в наших медицинских
вузах, на наш взгляд, просто вопиющее. Поскольку вузы готовят врачей, а
не ученых-медиков, то в силу этого вуз не может дать глубокую
подготовку в области прикладной статистики. Подготовка же в этой
области на этапе аспирантуры явно недостаточна. Более того, в ряде
институтов, имеющих аспирантуру по данным направлениям, аспиранты не
проходят подготовку по основам информатики и вычислительной техники.
-
-
- Третья причина - отсутствие действующей нормативной базы,
регламентирующей как саму систему анализа экспериментальных данных, так
и формы представления результатов статистического анализа наблюдений в
научных публикациях. Достаточно подробно этот аспект рассмотрен в
статье профессора А.И.Орлова [5]. За рубежом в этой части уже
наблюдаются позитивные изменения. Так, более 300 зарубежных журналов
придерживаются “Единых требований к рукописям, представляемым в
биомедицинские журналы” (так называемый стиль Ванкуверской группы, 1978
г.). Позже Ванкуверская группа была преобразована в Международный
комитет редакторов медицинских журналов - WAME, который ставит своей
целью повышение качества публикаций. Последняя редакция “Единых
требований...” от 1988 г. уже содержит ряд требований по описанию
используемых авторами методов статистики.
-
-
- Формированию такого состояния способствует и сама специфика
медико-биологической диссертационной тематики. Мы имеем в виду то, что
для многих научных направлений истинность выводов диссертационных работ
достаточно надежно проверяема. Это относится как к специальностям
физико-математического профиля, так и к техническим специальностям.
Однако для большинства медико-биологических диссертационных работ,
основные выводы которых апеллируют к результатам статистического
анализа выборочных наблюдений, проверка истинности этих выводов
довольно затруднительна, а во многих случаях и невозможна. Это
объясняется тем, что массив экспериментальных данных, на основе
которого автор получил представляемые на защиту положения и выводы,
оказывается доступным только самому диссертанту, поскольку матрица
первичных данных не приводится в виде “Приложения” к диссертации. В
результате не только статистическая проверка выводов диссертации в
настоящее время, но и реанализ данных в будущем, в случае появления
новых, более мощных статистических методов обработки и программных
продуктов, становиться невозможным.
-
-
-
- Немаловажным фактором является и то, каким образом в
настоящее время производится статистическая обработка в ходе подготовки
диссертаций. В большинстве случаев диссертанты вынуждены самостоятельно
выполнять данный этап исследования, зачастую недостаточно
квалифицированно, вследствие чего получаемые при этом выводы часто
сомнительны, либо ложны. Лишь в нескольких наиболее крупных НИИ имеются
специализированные подразделения, подобные отделу биостатистики
Всероссийского научно-исследовательского центра профилактической
медицины РАМН. Нередко в крупных НИИ РАМН, где количество современных
персональных компьютеров от 50 и более, число сантехников или
электриков значительно превосходит численность специалистов в области
информатики.
-
- Успешной защите медико-биологических диссертаций, содержащих
сомнительные или заведомо ложные статитические методы, способствует
также и отсутствие специалистов по прикладной статистике в составе
диссертационных советов по медико-биологическим специальностям.
Зачастую в отзывах о научно-практической значимости и отзывах
оппонентов вообще не рассматриваются эти аспекты выполненного
исследования. Особенно характерно такое положение для провинциальных
НИИ и вузов.
-
Список цитируемых источников.
-
- 1. Hall J.C. Use of t-test in the British Journal of Surgery // Brit.J.Surg. - 1982. - Vol.69. - N 1. - P. 55 - 57.
2. Friedman S.B., Phillips S. What's the difference? // Pediatrics. - 1981. Vol.68, N 5. - P. 644 - 646.
3. Будилова Е.В., Дрогалина Ж.А., Терехин А.Т. Основные направления
современной экологии и ее математический аппарат: анализ публикаций. //
Журнал общей биологии. - 1995. - Т.56. - № 2. с. 179 - 189.
4. Степенко Г.В. О преподавании теории вероятностей и математической статистики в школах Японии. Киев,
Институт математики АН УССР. 1976, с. 23.
5. Орлов А.И. О современных проблемах внедрения прикладной статистики и других статистических методов. //
Журнал “Заводская лаборатория”. 1991. № 1. - с. 67 - 74.
-
От редакции
-
- Публикуемая статья, по мнению редакции, поднимает важную
методологическую проблему, выходящую за рамки медицинской и
биологической науки. По рассмотренным в статье вопросам могут быть и
иные мнения. Редакция приглашает специалистов к дискуссии.
|
СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ
Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)
СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ
Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)
Отзывы заказчиков по статистическому анализу данных
Дистантное обучение
биостатистике с помощью IP-телефонии. Информация о специализированных курсах и семинарах по прикладной
биостатистике для студентов, аспирантов, докторантов и научных
сотрудников НИИ и вузов работающих в области биологии, медицины, социологии, психологии и т.д. (См. далее)
Отзывы по дистантному обучению статистике
|