Яндекс.Метрика Бюллетень ВАК N5 1997 г. ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ.

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ

Что можно узнать о наших родственниках,
победивших в этой войне...

Выбрав изображение, кликните мышкой, и Вы прочитаете о том, как ...


Редактор БИОМЕТРИКИ
В. Леонов

Пишите нам на
адрес

Яндекс
цитирования
Индекс цитирования
  Городской портал tomsk.ru


 

 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ.
В.П.Леонов - доцент факультета информатики Томского государственного университета;
П.В.Ижевский - ученый секретарь диссертационного совета Государственного научного центра Российской Федерации. Институт биофизики
.

Бюллетень ВАК N5 1997 г.

Анализ достаточно большого количества отечественных диссертаций и журнальных публикаций по медико-биологической тематике за последние годы показывает явное неблагополучие с применением в них статистических методов. Проблема представляется нам весьма актуальной и важной для повышения качества подготавливаемых в настоящее время диссертационных работ в области биологии и медицины. Кратко ее можно сформулировать так: не отвечающий современным возможностям уровень использования прикладной статистики в медицинской и биологической науке. Отметим, что в свое время эта же проблема стояла и в зарубежной медицинской и биологической науке. Так, по данным [1] установлено, что наиболее популярный тест на достоверность различий средних (t- критерий Стьюдента) применялся с ошибками в 51 случае из 72. Общая же частота ошибок в использовании статистических методов в статьях, посвященных анализу биомедицинских наблюдений, составляла от 44 до 78% (по данным того же источника). Аналогичные результаты приводятся и в других источниках [2]. Однако эти данные отражают состояние 15-летней давности. С тех пор, судя по современным публикациям, произошли существенные изменения и уровень использования прикладной статистики в зарубежной медицинской и биологической науке стал достаточно высок. Это объясняет несколькими причинами: более ранним и широким применением информатики в медико-биологических научных исследованиях, более глубоким статистическим образованием научных кадров и наличием специализированных подразделений, профессионально выполняющих статистическую обработку результатов наблюдений.  Тем самым задается более высокий уровень требований к подготовке научных кадров. Поэтому не будет большим преувеличением утверждение, что язык статистики становится таким же международным языком ученых, имеющих дело с анализом биомедицинских наблюдений, как и английский язык в целом в научных средах.

Кроме вышесказанного, проблема применения прикладной статистики в отечественной медицине имеет не только чисто научный, но и большой моральный аспект. Это связано в тем, что решения о применении новых лекарственных препаратов и методик лечения больных опираются на выводы, полученные с помощью статистического анализа большого количества наблюдений. Эти же решения, в свою очередь, непосредственно отражаются уже на здоровье населения страны. Очевидно, сколь ответственно и педантично в этом случае должен быть использован аппарат статистики.О большом потенциале информатики и статистики в медицине и биологии можно судить по работам таких известных авторов, как Автандилов Г.Г., Баевский Р.М., Гублер Е.В., Петров Р.И., Марчук Г.И., Максимов Г.К., Хаитов Р.М. и т.д. Однако в России для большинства исследователей в области медицины и биологии, статистика про- должает оставаться некой “terra incognita”.

Нередко применение статистики в диссертациях и статьях, подготовленных по медико-биологическим специальностям, является не более чем средством “онаучивания” утверждений автора и попыткой придать работе более солидный и весомый вид. Проведенный нами анализ более 200 диссертаций на соискание ученых степеней кандидата и доктора медицинских (биологических) наук, а также анализ публикаций 10 наиболее известных биомедицинских журналов (“Кардиология”, “Радиационная биология. Радиоэкология”, “Медицинская радиология”, “Иммунология” и т.д.) за последние 3 года показал, что в 30 - 40% работ используется только t-критерий Стьюдента, предложенный английским химиком У.Госсетом в 1908 году. Анализ этих работ показывает, что в половине случаев использование t-критерия Стьюдента неправомочно, а стало быть и полученные при этом выводы могут быть ложными. Известно, что первые статьи с применением t-криерия Стьюдента в основных медико-биологических журналах стали появляться в начале 60-х годов. С тех пор большинство авторов ограничиваются в своих работах использованием среднего значения и ошибки среднего в виде М ± m и t-критерием Стьюдента. Более чем в половине проанализирован- ных работ вообще не конкретизируется с помощью каких статистических критериев были получены декларируемые авторами статистические гипотезы. Как правило, в таких работах упоминание об использованных авторами статистических методах дается в виде, хорошо иллюстрирующем известное высказывание М.В.Ломоносова “Смутно пишут о том, о чем смутно представляют”. Чаще всего встречаются фразы:

1. Результаты обработаны статистически;
2. Результаты обработаны стандартными методами статистики;
3. Результаты обработаны методом вариационной статистики, и тому подобные.

Практически лишь в единичных работах можно встретить упоминание о таких современных методах статистики (широко применяемых в других научных направлениях), как множественная регрессия, кластерный и дискриминантный анализ, факторный анализ и анализ главных компонент и т.д. Достаточно редко используется и такой известный метод, как дисперсионный анализ (которому уже более 60 лет!). Крайне редко используются методы теории планирования экспериментов, которые позволяют минимизировать число наблюдений и увеличить количество извлекаемой при этом информации. В ряде проанализированных нами диссертаций встречаются столь грубые нарушения основных предпосылок использованных статистических методов, что выводы этих работ становятся бессмысленными. Например, используется множественная регрессия с качественными предикторными (независимыми) переменными, вычисляется парный коэффициент корреляции Пирсона без исключения явно аномальных наблюдений или производится сравнение двух средних с помощью t-критерия Стьюдента для признаков, не подчиняющихся нормальному распределению, для случая неравных генеральных дисперсий либо для ранговых (балльных) признаков и т.д. В таблице 1 даны основные результаты выполненного нами анализа.                                                                                                                             Таблица 1

Относительная частота использования методов статистического анализа

Форма представления результатов и используемые методы анализа и критерии

выра-
жение
М ± m

выра-
жение
p <

стат.
критерий
не указан

t - критерий Стьюдента

корреля-
ционный
анализ

критерий
Хи-квадрат
Пирсона

прочие методы статистика
не
применялась
вообще
Частота относи-тельная, % 79 62 64 33 7 6 10 20

Отметим, что в анализ не включались диссертации, в которых не использовался выборочный метод анализа наблюдений, а также обзорные статьи и статьи, имеющие лекционный характер.

 
Подобные же выводы делают и авторы статьи [3], в которой сообщены результаты наукометрического анализа публикаций журналов “ECOLOGY” и “ЭКОЛОГИЯ”, основанного на данных об индивидуальной и совместной частоте встречаемости в этих публикациях экологических и математических терминов. Авторы делают вывод о том, что существенно различаются по степени математизации англоязычные и русскоязычные статьи. Для иллюстрации этого утверждения мы приводим ниже одну из таблиц работы [3]. Как видно из таблицы 2, обращает на себя внимание значительное различие в частоте применения многомерных и непараметрических методов статистики в статьях сравниваемых журналов.

Таблица 2

Доля публикаций, использующих разные группы математических методов
( в % от числа статей из данного журнала)

Математические методы Журнал“ECOLOGY” Журнал“ЭКОЛОГИЯ”
Описательные и обзорные сообщения без статистических данных 4 24
Стандартные методы 77 69
Многомерные методы 60 13
Непараметрические методы 35 0
Категоризованные данные 15 0
Марковские процессы 2 0
Дифференциальные уравнения 2 0
 
По мере усложнения решаемых задач недостаток применения многомерных и непараметрических методов статистики перестает быть чисто “технологическим” и приобретает методологические черты. Между тем, в проанализированных нами диссертациях и статьях упоминаются персональные компьютеры, использованные для проведения статистической обработки данных, и современные статистические программы. На этом основании можно утверждать, что данная неблагополучная ситуация обусловлена не слабой материально-технической базой, а общим состоянием методологии анализа медико-биологических наблюдений. Уровень применения статистики в отечественной биологии и медицине можно проиллюстрировать следующим фактом. Так, 26 - 29 августа 1996 г. в Будапеште проходила ХVII конференция ISCB - международного общества клинической биостатистики. Из 15 членов исполнительного и научного комитетов этого общества нет ни одного представителя ни России, ни других республик бывшего СССР! Отсутствуют они и среди докладчиков пленарных заседаний и сателлитных минисимпозиумов. Отметим, что согласно информации Президента ISCB Dr.Karsten Schmidt, национальные отделения ISCB уже имеются в Польше и Венгрии.
 
На наш взгляд, имеется несколько основных причин создавшегося положения.
Первая причина имеет достаточно сильную связь с доминировавшей ранее идеологией, которая игнорировала статистику как науку, позволяющую принимать оптимальные решения в условиях недостатка информации (определение статистика А.Вальда).
Вторая причина заключается в существующей концепции преподавания математики. Если с понятием функции, как детерминированной зависимости, наши школьники знакомятся еще в начальных классах, то статистические зависимости вообще остаются за рамками учебных программ. Для сравнения можно сослаться на опыт развитых стран, в которых данный раздел математики начинают изучать еще в школе. Например, в Японии с 1972 г. знакомство с основными понятиями теории вероятностей и математической статистики введено, начиная уже со второго класса, т.е. с семилетнего возраста [4]. А на 7 - 9 годах школьного обучения детям прививают навыки построения гистограмм, корреляционных таблиц и диаграмм и т.д.
Положение с преподаванием статистики в наших медицинских вузах, на наш взгляд, просто вопиющее. Поскольку вузы готовят врачей, а не учёных-медиков, то в силу этого вуз не может дать глубокую подготовку в области прикладной статистики. Подготовка же в этой области на этапе аспирантуры явно недостаточна. Более того, в ряде институтов, имеющих аспирантуру по данным направлениям, аспиранты не проходят подготовку по основам информатики и вычислительной техники.
Третья причина - отсутствие действующей нормативной базы, регламентирующей как саму систему анализа экспериментальных данных, так и формы представления результатов статистического анализа наблюдений в научных публикациях. Достаточно подробно этот аспект рассмотрен в статье профессора А.И.Орлова [5]. За рубежом в этой части уже наблюдаются позитивные изменения. Так, более 300 зарубежных журналов придерживаются “Единых требований к рукописям, представляемым в биомедицинские журналы” (так называемый стиль Ванкуверской группы, 1978 г.). Позже Ванкуверская группа была преобразована в Международный комитет редакторов медицинских журналов - WAME, который ставит своей целью повышение качества публикаций.  Последняя редакция “Единых требований...” от 1988 г. уже содержит ряд требований по описанию используемых авторами методов статистики.
 
Формированию такого состояния способствует и сама специфика медико-биологической диссертационной тематики. Мы имеем в виду то, что для многих научных направлений истинность выводов диссертационных работ достаточно надежно проверяема. Это относится как к специальностям физико-математического профиля, так и к техническим специальностям. Однако для большинства медико-биологических диссертационных работ, основные выводы которых апеллируют к результатам статистического анализа выборочных наблюдений, проверка истинности этих выводов довольно затруднительна, а во многих случаях и невозможна. Это объясняется тем, что массив экспериментальных данных, на основе которого автор получил представляемые на защиту положения и выводы, оказывается доступным только самому диссертанту, поскольку матрица первичных данных не приводится в виде “Приложения” к диссертации. В результате не только статистическая проверка выводов диссертации в настоящее время, но и реанализ данных в будущем, в случае появления новых, более мощных статистических методов обработки и программных продуктов, становиться невозможным.
 
Немаловажным фактором является и то, каким образом в настоящее время производится статистическая обработка в ходе подготовки диссертаций. В большинстве случаев диссертанты вынуждены самостоятельно выполнять данный этап исследования, зачастую недостаточно квалифицированно, вследствие чего получаемые при этом выводы часто сомнительны, либо ложны. Лишь в нескольких наиболее крупных НИИ имеются специализированные подразделения, подобные отделу биостатистики Всероссийского научно-исследовательского центра профилактической медицины РАМН. Нередко в крупных НИИ РАМН, где количество современных персональных компьютеров от 50 и более, число сантехников или электриков значительно превосходит численность специалистов в области информатики.
 
Успешной защите медико-биологических диссертаций, содержащих сомнительные или заведомо ложные статитические методы, способствует также и отсутствие специалистов по прикладной статистике в составе диссертационных советов по медико-биологическим специальностям. Зачастую в отзывах о научно-практической значимости и отзывах оппонентов вообще не рассматриваются эти аспекты выполненного исследования. Особенно характерно такое положение для провинциальных НИИ и вузов.

Список цитируемых источников.
 
1. Hall J.C. Use of t-test in the British Journal of Surgery // Brit.J.Surg. - 1982. - Vol.69. - N 1. - P. 55 - 57.
2. Friedman S.B., Phillips S. What's the difference? // Pediatrics. - 1981. Vol.68, N 5. - P. 644 - 646.
3. Будилова Е.В., Дрогалина Ж.А., Терехин А.Т. Основные направления современной экологии и ее математический аппарат: анализ публикаций. // Журнал общей биологии. - 1995. - Т.56. - № 2. с. 179 - 189.
4. Степенко Г.В. О преподавании теории вероятностей и математической статистики в школах Японии. Киев, Институт математики АН УССР. 1976, с. 23.
5. Орлов А.И. О современных проблемах внедрения прикладной статистики и других статистических методов. // Журнал “Заводская лаборатория”. 1991. № 1. - с. 67 - 74.

От редакции Бюллетеня ВАК
 
Публикуемая статья, по мнению редакции, поднимает важную методологическую проблему, выходящую за рамки медицинской и биологической науки. По рассмотренным в статье вопросам могут быть и иные мнения. Редакция приглашает специалистов к дискуссии.  
СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

Отзывы заказчиков по статистическому анализу данных

23 примера оформления данных, их описания и описания целей исследования


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

Д.С. Симанков. Применение метода логистической регрессии для факторов риска, влияющих на исход операции в условиях искусственного кровообращения

В.В. Половинкин ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева
ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко
  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская
"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с. Актуальность этого издания весьма велика. По-прежнему в биомедицинских статьях и диссертациях публикуется масса статистических нелепостей, как образцы "статистического самоудовлетворения" и "статистического макияжа". Например, в двух диссертациях, выполненных в 2014 и 2015 гг. в Алтайском медуниверситете по разным специальностям, но при этом в полностью идентичных описаниях, состоящих из 94 слов, написано следующее. «Полученные данные были статистически обработаны с использованием программ Microsoft Offis Exel 2007. Достоверность различий между средними величинами определяли с помощью критерия значимости Стьюдента (t). Нормальность распределений в группах оценивали по критерию Шапиро-Уилка». Далее сообщается об использовании критерия Манна-Уитни, и т.д. Очевидно, что под Offis Exel авторы подразумевали Office Excel. Сложнее было бы об этом догадаться, если бы авторы написали Offis Exul. Вывод: оба диссертанта, как и члены двух диссертационных советов, не знают многого, в том числе описанного в этой книге. Например, не знают того, что в пакете Office Excel нет критериев Шапиро-Уилка и Манна-Уитни. Данная книга обучит правильно и хорошо описывать и понимать результаты статистического анализа. Поэтому исследователи станут более качественно выполнять статистический анализ, получая правильную технологию лечения пациентов. Что в результате будет снижать смертность населения, а также себестоимость лечебных процедур.  


1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"