Яндекс.Метрика Бюллетень ВАК N5 1997 г. ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ.

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ

Что можно узнать о наших родственниках,
победивших в этой войне...

Выбрав изображение, кликните мышкой, и Вы прочитаете о том, как ...


Редактор БИОМЕТРИКИ
В. Леонов

Пишите нам на
адрес

Яндекс
цитирования
Индекс цитирования
  Городской портал tomsk.ru


 

 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ.
В.П.Леонов - доцент факультета информатики Томского государственного университета;
П.В.Ижевский - ученый секретарь диссертационного совета Государственного научного центра Российской Федерации. Институт биофизики
.

Бюллетень ВАК №5, 1997 г.

Анализ достаточно большого количества отечественных диссертаций и журнальных публикаций по медико-биологической тематике за последние годы показывает явное неблагополучие с применением в них статистических методов. Проблема представляется нам весьма актуальной и важной для повышения качества подготавливаемых в настоящее время диссертационных работ в области биологии и медицины. Кратко ее можно сформулировать так: не отвечающий современным возможностям уровень использования прикладной статистики в медицинской и биологической науке. Отметим, что в свое время эта же проблема стояла и в зарубежной медицинской и биологической науке. Так, по данным [1] установлено, что наиболее популярный тест на достоверность различий средних (t- критерий Стьюдента) применялся с ошибками в 51 случае из 72. Общая же частота ошибок в использовании статистических методов в статьях, посвященных анализу биомедицинских наблюдений, составляла от 44 до 78% (по данным того же источника). Аналогичные результаты приводятся и в других источниках [2]. Однако эти данные отражают состояние 15-летней давности. С тех пор, судя по современным публикациям, произошли существенные изменения и уровень использования прикладной статистики в зарубежной медицинской и биологической науке стал достаточно высок. Это объясняет несколькими причинами: более ранним и широким применением информатики в медико-биологических научных исследованиях, более глубоким статистическим образованием научных кадров и наличием специализированных подразделений, профессионально выполняющих статистическую обработку результатов наблюдений.  Тем самым задается более высокий уровень требований к подготовке научных кадров. Поэтому не будет большим преувеличением утверждение, что язык статистики становится таким же международным языком ученых, имеющих дело с анализом биомедицинских наблюдений, как и английский язык в целом в научных средах.

Кроме вышесказанного, проблема применения прикладной статистики в отечественной медицине имеет не только чисто научный, но и большой моральный аспект. Это связано в тем, что решения о применении новых лекарственных препаратов и методик лечения больных опираются на выводы, полученные с помощью статистического анализа большого количества наблюдений. Эти же решения, в свою очередь, непосредственно отражаются уже на здоровье населения страны. Очевидно, сколь ответственно и педантично в этом случае должен быть использован аппарат статистики.О большом потенциале информатики и статистики в медицине и биологии можно судить по работам таких известных авторов, как Автандилов Г.Г., Баевский Р.М., Гублер Е.В., Петров Р.И., Марчук Г.И., Максимов Г.К., Хаитов Р.М. и т.д. Однако в России для большинства исследователей в области медицины и биологии, статистика про- должает оставаться некой “terra incognita”.

Нередко применение статистики в диссертациях и статьях, подготовленных по медико-биологическим специальностям, является не более чем средством “онаучивания” утверждений автора и попыткой придать работе более солидный и весомый вид. Проведенный нами анализ более 200 диссертаций на соискание ученых степеней кандидата и доктора медицинских (биологических) наук, а также анализ публикаций 10 наиболее известных биомедицинских журналов (“Кардиология”, “Радиационная биология. Радиоэкология”, “Медицинская радиология”, “Иммунология” и т.д.) за последние 3 года показал, что в 30 - 40% работ используется только t-критерий Стьюдента, предложенный английским химиком У.Госсетом в 1908 году. Анализ этих работ показывает, что в половине случаев использование t-критерия Стьюдента неправомочно, а стало быть и полученные при этом выводы могут быть ложными. Известно, что первые статьи с применением t-критерия Стьюдента в основных медико-биологических журналах стали появляться в начале 60-х годов. С тех пор большинство авторов ограничиваются в своих работах использованием среднего значения и ошибки среднего в виде М ± m и t-критерием Стьюдента. Более чем в половине проанализированных работ вообще не конкретизируется с помощью каких статистических критериев были получены декларируемые авторами статистические гипотезы. Как правило, в таких работах упоминание об использованных авторами статистических методах дается в виде, хорошо иллюстрирующем известное высказывание М.В.Ломоносова “Смутно пишут о том, о чем смутно представляют”. Чаще всего встречаются фразы:

1. Результаты обработаны статистически;
2. Результаты обработаны стандартными методами статистики;
3. Результаты обработаны методом вариационной статистики, и тому подобные.

Практически лишь в единичных работах можно встретить упоминание о таких современных методах статистики (широко применяемых в других научных направлениях), как множественная регрессия, кластерный и дискриминантный анализ, факторный анализ и анализ главных компонент и т.д. Достаточно редко используется и такой известный метод, как дисперсионный анализ (которому уже более 60 лет!). Крайне редко используются методы теории планирования экспериментов, которые позволяют минимизировать число наблюдений и увеличить количество извлекаемой при этом информации. В ряде проанализированных нами диссертаций встречаются столь грубые нарушения основных предпосылок использованных статистических методов, что выводы этих работ становятся бессмысленными. Например, используется множественная регрессия с качественными предикторными (независимыми) переменными, вычисляется парный коэффициент корреляции Пирсона без исключения явно аномальных наблюдений или производится сравнение двух средних с помощью t-критерия Стьюдента для признаков, не подчиняющихся нормальному распределению, для случая неравных генеральных дисперсий либо для ранговых (балльных) признаков и т.д. В таблице 1 даны основные результаты выполненного нами анализа.       

                                                                                                                      Таблица 1

Относительная частота использования методов статистического анализа

Форма представления результатов и используемые методы анализа и критерии

выра-
жение
М ± m

выра-
жение
p <

стат.
критерий
не указан

t - критерий Стьюдента

корреля-
ционный
анализ

критерий
Хи-квадрат
Пирсона

прочие методы статистика
не
применялась
вообще
Частота относи-тельная, % 79 62 64 33 7 6 10 20

Отметим, что в анализ не включались диссертации, в которых не использовался выборочный метод анализа наблюдений, а также обзорные статьи и статьи, имеющие лекционный характер.

 
Подобные же выводы делают и авторы статьи [3], в которой сообщены результаты наукометрического анализа публикаций журналов “ECOLOGY” и “ЭКОЛОГИЯ”, основанного на данных об индивидуальной и совместной частоте встречаемости в этих публикациях экологических и математических терминов. Авторы делают вывод о том, что существенно различаются по степени математизации англоязычные и русскоязычные статьи. Для иллюстрации этого утверждения мы приводим ниже одну из таблиц работы [3]. Как видно из таблицы 2, обращает на себя внимание значительное различие в частоте применения многомерных и непараметрических методов статистики в статьях сравниваемых журналов.

Таблица 2

Доля публикаций, использующих разные группы математических методов
( в % от числа статей из данного журнала)

Математические методы Журнал“ECOLOGY” Журнал“ЭКОЛОГИЯ”
Описательные и обзорные сообщения без статистических данных 4 24
Стандартные методы 77 69
Многомерные методы 60 13
Непараметрические методы 35 0
Категоризованные данные 15 0
Марковские процессы 2 0
Дифференциальные уравнения 2 0
 
 
 
По мере усложнения решаемых задач недостаток применения многомерных и непараметрических методов статистики перестает быть чисто “технологическим” и приобретает методологические черты. Между тем, в проанализированных нами диссертациях и статьях упоминаются персональные компьютеры, использованные для проведения статистической обработки данных, и современные статистические программы. На этом основании можно утверждать, что данная неблагополучная ситуация обусловлена не слабой материально-технической базой, а общим состоянием методологии анализа медико-биологических наблюдений. Уровень применения статистики в отечественной биологии и медицине можно проиллюстрировать следующим фактом. Так, 26 - 29 августа 1996 г. в Будапеште проходила ХVII конференция ISCB - международного общества клинической биостатистики. Из 15 членов исполнительного и научного комитетов этого общества нет ни одного представителя ни России, ни других республик бывшего СССР! Отсутствуют они и среди докладчиков пленарных заседаний и сателлитных минисимпозиумов. Отметим, что согласно информации Президента ISCB Dr.Karsten Schmidt, национальные отделения ISCB уже имеются в Польше и Венгрии.
 
На наш взгляд, имеется несколько основных причин создавшегося положения.
Первая причина имеет достаточно сильную связь с доминировавшей ранее идеологией, которая игнорировала статистику как науку, позволяющую принимать оптимальные решения в условиях недостатка информации (определение статистика А.Вальда).
Вторая причина заключается в существующей концепции преподавания математики. Если с понятием функции, как детерминированной зависимости, наши школьники знакомятся еще в начальных классах, то статистические зависимости вообще остаются за рамками учебных программ. Для сравнения можно сослаться на опыт развитых стран, в которых данный раздел математики начинают изучать еще в школе. Например, в Японии с 1972 г. знакомство с основными понятиями теории вероятностей и математической статистики введено, начиная уже со второго класса, т.е. с семилетнего возраста [4]. А на 7 - 9 годах школьного обучения детям прививают навыки построения гистограмм, корреляционных таблиц и диаграмм и т.д.
Положение с преподаванием статистики в наших медицинских вузах, на наш взгляд, просто вопиющее. Поскольку вузы готовят врачей, а не учёных-медиков, то в силу этого вуз не может дать глубокую подготовку в области прикладной статистики. Подготовка же в этой области на этапе аспирантуры явно недостаточна. Более того, в ряде институтов, имеющих аспирантуру по данным направлениям, аспиранты не проходят подготовку по основам информатики и вычислительной техники.
Третья причина - отсутствие действующей нормативной базы, регламентирующей как саму систему анализа экспериментальных данных, так и формы представления результатов статистического анализа наблюдений в научных публикациях. Достаточно подробно этот аспект рассмотрен в статье профессора А.И.Орлова [5]. За рубежом в этой части уже наблюдаются позитивные изменения. Так, более 300 зарубежных журналов придерживаются “Единых требований к рукописям, представляемым в биомедицинские журналы” (так называемый стиль Ванкуверской группы, 1978 г.). Позже Ванкуверская группа была преобразована в Международный комитет редакторов медицинских журналов - WAME, который ставит своей целью повышение качества публикаций.  Последняя редакция “Единых требований...” от 1988 г. уже содержит ряд требований по описанию используемых авторами методов статистики.
 
Формированию такого состояния способствует и сама специфика медико-биологической диссертационной тематики. Мы имеем в виду то, что для многих научных направлений истинность выводов диссертационных работ достаточно надежно проверяема. Это относится как к специальностям физико-математического профиля, так и к техническим специальностям. Однако для большинства медико-биологических диссертационных работ, основные выводы которых апеллируют к результатам статистического анализа выборочных наблюдений, проверка истинности этих выводов довольно затруднительна, а во многих случаях и невозможна. Это объясняется тем, что массив экспериментальных данных, на основе которого автор получил представляемые на защиту положения и выводы, оказывается доступным только самому диссертанту, поскольку матрица первичных данных не приводится в виде “Приложения” к диссертации. В результате не только статистическая проверка выводов диссертации в настоящее время, но и реанализ данных в будущем, в случае появления новых, более мощных статистических методов обработки и программных продуктов, становиться невозможным.
 
Немаловажным фактором является и то, каким образом в настоящее время производится статистическая обработка в ходе подготовки диссертаций. В большинстве случаев диссертанты вынуждены самостоятельно выполнять данный этап исследования, зачастую недостаточно квалифицированно, вследствие чего получаемые при этом выводы часто сомнительны, либо ложны. Лишь в нескольких наиболее крупных НИИ имеются специализированные подразделения, подобные отделу биостатистики Всероссийского научно-исследовательского центра профилактической медицины РАМН. Нередко в крупных НИИ РАМН, где количество современных персональных компьютеров от 50 и более, число сантехников или электриков значительно превосходит численность специалистов в области информатики.
 
Успешной защите медико-биологических диссертаций, содержащих сомнительные или заведомо ложные статитические методы, способствует также и отсутствие специалистов по прикладной статистике в составе диссертационных советов по медико-биологическим специальностям. Зачастую в отзывах о научно-практической значимости и отзывах оппонентов вообще не рассматриваются эти аспекты выполненного исследования. Особенно характерно такое положение для провинциальных НИИ и вузов.

Список цитируемых источников.
 
1. Hall J.C. Use of t-test in the British Journal of Surgery // Brit.J.Surg. - 1982. - Vol.69. - N 1. - P. 55 - 57.
2. Friedman S.B., Phillips S. What's the difference? // Pediatrics. - 1981. Vol.68, N 5. - P. 644 - 646.
3. Будилова Е.В., Дрогалина Ж.А., Терехин А.Т. Основные направления современной экологии и ее математический аппарат: анализ публикаций. // Журнал общей биологии. - 1995. - Т.56. - № 2. с. 179 - 189.
4. Степенко Г.В. О преподавании теории вероятностей и математической статистики в школах Японии. Киев, Институт математики АН УССР. 1976, с. 23.
5. Орлов А.И. О современных проблемах внедрения прикладной статистики и других статистических методов. // Журнал “Заводская лаборатория”. 1991. № 1. - с. 67 - 74.


От редакции Бюллетеня ВАК
 
Публикуемая статья, по мнению редакции, поднимает важную методологическую проблему, выходящую за рамки медицинской и биологической науки. По рассмотренным в статье вопросам могут быть и иные мнения. Редакция приглашает специалистов к дискуссии.  

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

Отзывы заказчиков по статистическому анализу данных

Очередной отзыв о нашем сотрудничестве от Водяновой О.В., аспиранта Белорусской медицинской академии последипломного образования, г. Минск.

Очередной отзыв о нашем сотрудничестве от Д.А. Бусыгина, врача клинической лабораторной диагностики, г. Омск.

Очередной отзыв о нашем сотрудничестве от Ловриковой М.А., врача ультразвуковой диагностики, аспиранта кафедры терапии педиатрического и стоматологического факультетов ФГБОУ ВО ДВГМУ Минздрава России, г. Хабаровск.

БЯК(ВАК)овский журнал "Современные проблемы науки и образования". Главный редактор: Ледванов М.Ю., д.м.н., профессор; заместитель главного редактора Курзанов А.Н., д.м.н., профессор; ответственный секретарь редакции к.м.н. Бизенкова М.Н.

300 «мусорным» журналам указали на место. Из списка РИНЦ исключены более 300 «мусорных» журналов

Три Программы, вместо одной. И. Семенов, Москва.

В. Леонов. СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ИССЛЕДОВАТЕЛЕЙ. (время и опыт)

... мы, как исследователи, получаем не всегда правильные результаты. Корнеева Н.В., доцент кафедры факультетской терапии ДВГМУ г. Хабаровска.

... Конечная версия Программы содержала 93 пункта. New York,  Ruyman E.

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов. Самая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах...

Сравниваем средние, а также и ...
В. Леонов

     Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Такими новыми сравнениями являются проверки равенства дисперсий, коэффициентов корреляции, коэффициентов регрессии или векторов групповых средних, сравнение групп многомерными методами, и т.д. В статье объяснена большая ценность обнаружения не нормального распределения признака. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками. Что является важнейшим аргументом по формулировке списка проверки взаимосвязей важнейших признаков проводимого исследования. Специфика других сравнений хорошо иллюстрируется различными графиками, а также наличием списка литературы из 98 книг и статей, полезных для этой тематики. Причём более половины из них имеют ссылки на доступные в интернете данные издания.

23 примера оформления данных, их описания и описания целей исследования


RusDASL - российская библиотека данных  для изучающих биометрику и биостатистику. DASL (The Data and Story Library ) - под такой аббревиатурой на веб-сайте Carnegie Mellon University размещена известная библиотека исходных статистических данных данных из различных отраслей науки. Теперь аналогичная библиотека открыта на БИОМЕТРИКЕ и для российских пользователей...


Логистическая регрессия в медицине и биологии.
Леонов В.

В серии статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии.


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

Д.С. Симанков. Применение метода логистической регрессии для факторов риска, влияющих на исход операции в условиях искусственного кровообращения

В.В. Половинкин ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева
ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко
  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская
"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с. Актуальность этого издания весьма велика. По-прежнему в биомедицинских статьях и диссертациях публикуется масса статистических нелепостей, как образцы "статистического самоудовлетворения" и "статистического макияжа". Например, в двух диссертациях, выполненных в 2014 и 2015 гг. в Алтайском медуниверситете по разным специальностям, но при этом в полностью идентичных описаниях, состоящих из 94 слов, написано следующее. «Полученные данные были статистически обработаны с использованием программ Microsoft Offis Exel 2007. Достоверность различий между средними величинами определяли с помощью критерия значимости Стьюдента (t). Нормальность распределений в группах оценивали по критерию Шапиро-Уилка». Далее сообщается об использовании критерия Манна-Уитни, и т.д. Очевидно, что под Offis Exel авторы подразумевали Office Excel. Сложнее было бы об этом догадаться, если бы авторы написали Offis Exul. Вывод: оба диссертанта, как и члены двух диссертационных советов, не знают многого, в том числе описанного в этой книге. Например, не знают того, что в пакете Office Excel нет критериев Шапиро-Уилка и Манна-Уитни. Данная книга обучит правильно и хорошо описывать и понимать результаты статистического анализа. Поэтому исследователи станут более качественно выполнять статистический анализ, получая правильную технологию лечения пациентов. Что в результате будет снижать смертность населения, а также себестоимость лечебных процедур.  


1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"