Яндекс.Метрика

СТАТИСТИКА ЭКСПЕРИМЕНТАЛЬНОЙ МЕДИЦИНЫ

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят.
 
Пишите нам на адрес

Выбрав любое изображение, кликните по нему мышкой, и Вы прочитаете о том, как ...

Редактор БИОМЕТРИКИ
В. Леонов

Яндекс
цитирования
Яндекс цитирования
 
25 наиболее популярных ссылок, посещаемых читателями нашего сайта

http://www.biometrica.tomsk.ru/logit_8.htm
http://www.biometrica.tomsk.ru/kuzbass5.htm
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/kuzbass6.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/principals.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/paradigma.htm
http://www.biometrica.tomsk.ru/index.htm
http://www.biometrica.tomsk.ru/freq1.htm

http://www.biometrica.tomsk.ru/logit_1.htm
http://www.biometrica.tomsk.ru/cluster_3.htm
http://www.biometrica.tomsk.ru/k_s.htm
http://www.biometrica.tomsk.ru/edu_1.htm
http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/kuzbass2.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

23 примера оформления данных, их описания и описания целей исследования.

Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин.
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская. 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева.
ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев. 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко.
  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская
"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"


ОТЗЫВ врача-кардиолога М.В. Емельяненко, ФКУ «Центральный военный госпиталь имени П.В. Мандрыка» МО РФ, Москва, о проведённом статистическом анализе.  Хочу выразить глубокую признательность за качественный и весьма объёмный труд, проделанный Вами по статистическому анализу моей базы данных. Особенную благодарность, без сомнения, хотелось бы выразить руководителю проекта «БИОМЕТРИКА» - Василию Петровичу Леонову. Причина такой благодарности следующая. Помимо структурированного статистического анализа присланных в Ваш адрес медицинских данных, Вы подробно и, что самое невероятное,  – доступным образом разъяснили мне суть каждого метода, который был применён при анализе моей матрицы. (далее...)

ОТЗЫВ Ахметова А., (Казахстан), о сотрудничестве с БИОМЕТРИКОЙ. Когда я взялся за написание диссертации, то вначале я пытался самостоятельно выполнить статистический анализ собранных мною данных. Для этого пробовал использовать EXCEL и STATISTICA. Однако по мере расширения набора используемых методов анализа, всё яснее стал осознавать, что я не понимаю как сами методы, так и получаемые результаты. Чтобы лучше в этом разобраться, стал очень часто посещать сайт БИОМЕТРИКА. Иногда ежедневно по 2-3 часа читал на этом сайте разные статьи. Особенно полезными были обзоры по Кузбассу, по кардиологии, а также статья "Долгое прощание с лысенковщиной". (далее...)"


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине.

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


КУНСТКАМЕРА. Обзор большой коллекции медицинских статей и диссертаций с существенными ошибками и нелепыми использованиями и описаниями методов статистики.


Логистическая регрессия в медицине и биологии. Леонов В.

В серии из 9 статей рассмотрены основы метода логистической регрессии. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии



Отзывы читателей обзора "Статистика в кардиологии. 15 лет спустя". В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...


Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.

Отзывы читателей обзора "Статистика в кардиологии. 15 лет спустя". В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...

ВАК для учёных? или ВАК для… бумагомарак? «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год. За 2 года, прошедших с момента публикации этой статьи, её прочитали более 29 тысяч читателей.  "Плагиат, обнаруживаемый в диссертациях, это «пена» диссертационного бизнеса. Поскольку в производстве диссертаций «под заказ» гораздо легче просто копировать фрагменты одних диссертаций, вставляя их в очередные заказные диссертации. Производители такого «товара» фабрикуют не только диссертации, но и массу журнальных статей. Основные причины появления этого бизнеса описал профессор Е.В. Балацкий ещё в 2005 г. [1-2], изложив и сценарии его ликвидации. Одной из ключевых причин рождения этого бизнеса являются изменения в Положениях ВАК".

Балацкий Е.В. Диссертационная ловушка

Россия по уровню технологий отстает от развитых стран на 50 лет

Диссертационные войны. Как борьба с плагиатом в диссертациях переместилась из науки в политику

Доказательная медицина: история, эволюция, роль в медицине

Бен Голдакр. Плохая статистика в науке.

ЮНЕСКО отмечает снижение вклада России в мировую науку. ЮНЕСКО после пятилетнего перерыва опубликовала доклад по науке до 2030 года. Статистические показатели для России ухудшились по сравнению с большинством ведущих научных стран, несмотря на то, что многие данные взяты из официальных российских источников.

Плохая наука. НЕКОРРЕКТНЫЕ ИССЛЕДОВАНИЯ ПРИВОДЯТ К ЛОЖНОМУ ЗНАНИЮ, А ИНОГДА — К ГИБЕЛИ ЛЮДЕЙ

ПОЛОВИНУ ОТКРЫТЫХ НАУЧНЫХ ЖУРНАЛОВ НАЗВАЛИ «МУСОРОМ» ... Результат был ошеломляющим: 157 журналов приняли заведомо «бракованные» статьи к публикации, причем около 80 из них даже не подвергали их должной проверке. Отвергли статьи 98 журналов, а остальные к настоящему моменту не успели принять решения. ...«Журналы без контроля качества деструктивны, особенно для развивающихся стран, где правительственные учреждения и университеты заполнены людьми с фальшивыми научными званиями»


Новые полезные книги...

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с. Актуальность этого издания весьма велика. По-прежнему в биомедицинских статьях и диссертациях публикуется масса статистических нелепостей, как образцы "статистического самоудовлетворения" и "статистического макияжа". Например, в двух диссертациях, выполненных в 2014 и 2015 гг. в Алтайском медуниверситете по разным специальностям, но при этом в полностью идентичных описаниях, состоящих из 94 слов, написано следующее. «Полученные данные были статистически обработаны с использованием программ Microsoft Offis Exel 2007. Достоверность различий между средними величинами определяли с помощью критерия значимости Стьюдента (t). Нормальность распределений в группах оценивали по критерию Шапиро-Уилка». Далее сообщается об использовании критерия Манна-Уитни, и т.д. Очевидно, что под Offis Exel авторы подразумевали Office Excel. Сложнее было бы об этом догадаться, если бы авторы написали Offis Exul. Вывод: оба диссертанта, как и члены двух диссертационных советов, не знают многого, в том числе описанного в этой книге. Например, не знают того, что в пакете Office Excel нет критериев Шапиро-Уилка и Манна-Уитни. Данная книга обучит правильно и хорошо описывать и понимать результаты статистического анализа. Поэтому исследователи станут более качественно выполнять статистический анализ, получая правильную технологию лечения пациентов. Что в результате будет снижать смертность населения, а также себестоимость лечебных процедур.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с.
Предыдущие издания оригинала этой книги были опубликованы в 2000, 2005 и 2009 гг. Третье издание книги, как и два предыдущих, имеет целью донести до читателя основные понятия и принципы медицинской статистики, которые достаточно широко используются зарубежными медиками и биологами. Книга содержит необходимую теоретическую часть, а также в доступной форме даёт практическое описание того, как могут применяться статистические методы в реальных клинических исследованиях. Низкий уровень использования статистики в отечественной медицинской науке является одной из основных причин, по которым уже 111 лет Нобелевские премии по медицине не присуждаются россиянам. Ценность этой книги для медицинской науки определяется и проводимой в России реформой отечественной науки, в том числе реформой ВАК и системы научной аттестации. Учебное пособие предназначено для студентов, аспирантов и докторантов медицинских вузов, биологических факультетов университетов, врачей, исследователей-клиницистов и всех, кто является сторонником доказательной медицины.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.
Издание представляет собой вводный курс по принципам статистики. Представлены базовые понятия и принципы статистических исследований применительно к медицине. В отличие от большинства подобных изданий, указанные темы изложены кратко и доступно. Для чтения книги не требуется знание сложных разделов высшей математики, вполне достаточно тех, что даются в школе. Внедрение в практику принципов доказательной медицины диктует необходимость понимания статистики. После знакомства с книгой читатель сможет критически оценивать многочисленные публикации, содержащие статистическую терминологию и результаты описанных исследований. Полученные знания помогут избежать ошибок в планировании биомедицинских исследований, а также в изложении их результатов. Большим преимуществом книги служат глоссарий и подробный предметный указатель.
Для студентов, аспирантов, научных работников, а также врачей всех специальностей.


Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.
Данная книга является наиболее популярным в мире руководством по доказательной медицине, ставшее известным и в России. Руководство предназначено для студентов и врачей. За 18 лет с момента первого издания в 1996 г., эта книга переведена на восемь языков (испанский, итальянский, китайский, немецкий, русский, французский, чешский, японский) и напечатана огромными тиражами. Руководство завоевало признание практикующих врачей, преподавателей и студентов во многих странах; по нему преподается медицина, основанная на доказательствах, в медицинских школах всего мира. В книге 17 глав, среди которых есть и глава "Статистика для неспециалиста". Эта главу мы дополнили большим списком русскоязычной литературы как по самой статистике, так и по биостатистике. А начинается книга с определения понятия "доказательная медицина". Итак, что же такое "доказательная медицина"?
Что, чем, и зачем "доказывают"? Читайте эту книгу!


Логистическая регрессия в медицине и биологии. Леонов В.

В серии из 9 статей рассмотрены основы метода логистической регрессии. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии


Долгое прощание с лысенковщиной

Семинары по биометрике


КУНСТКАМЕРА. Обзор большой коллекции медицинских статей и диссертаций с существенными ошибками и нелепыми использованиями и описаниями методов статистики.

Экспозиция 1
Экспозиция 2
Экспозиция 3
Экспозиция 4

Для удобства работы с экспонатами они отсортированы по фамилиям авторов, городам, в которых проживают авторы, и по организациям, в которых работают авторы, а также по научным специальностям. 

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Сравнительная характеристика показателей кардиореспираторной системы спортсменов и лиц, не занимающихся спортом, в условиях северного промышленного города", Тюменский государственный университет, Тюмень - 2006 г.

Новый экспонат КУНСTКАМЕРЫ - Диссертация «Анализ полиморфизма генов сердечно-сосудистой системы и системы детоксикации в различных возрастных группах Санкт-Петербурга». Обсуждаемая диссертация являет собой ярчайший пример того, какую злую шутку может сыграть с автором игнорирование проблемы множественных сравнений при статистическом анализе полученных данных.

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Оценка проаритмических факторов при постинфарктной систолической дисфункции миокарда и эффективности их фармакологической коррекции", Кемеровская государственная медицинская академия, Кемерово - 2004 г.


Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения. Вот как пишет об этом известный специалист в области прикладной статистики профессор А.И. Орлов в своей книге ЭКОНОМЕТРИКА (Издательство ЭКЗАМЕН, Москва, 2004. - 576 с.). "Приведённые описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений  соответствующих случайных величин. Очевидно, для оправдания или обоснованного изменения существующей практики анализа статистических данных требуется изучить свойства процедур анализа данных при «незаконном» применении. Изучение процедур отбраковки показало, что они крайне неустойчивы к отклонениям от нормальности, а потому применять их для обработки реальных данных нецелесообразно; поэтому нельзя утверждать, что произвольно взятая процедура устойчива к отклонениям от нормальности". Именно Александр Иванович в своём письме от 4 апреля 1998 г. и обратил моё внимание на эту проблему.


Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.

Отзывы читателей обзора "Статистика в кардиологии. 15 лет спустя". В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...


ВАК для учёных? или ВАК для… бумагомарак? «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год. За 2 года, прошедших с момента публикации этой статьи, её прочитали более 29 тысяч читателей.  "Плагиат, обнаруживаемый в диссертациях, это «пена» диссертационного бизнеса. Поскольку в производстве диссертаций «под заказ» гораздо легче просто копировать фрагменты одних диссертаций, вставляя их в очередные заказные диссертации. Производители такого «товара» фабрикуют не только диссертации, но и массу журнальных статей. Основные причины появления этого бизнеса описал профессор Е.В. Балацкий ещё в 2005 г. [1-2], изложив и сценарии его ликвидации. Одной из ключевых причин рождения этого бизнеса являются изменения в Положениях ВАК".


Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА.
КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?
ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ
.
«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».
КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 
ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.
«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН». ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.
КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?
ВМЕСТО ЗАКЛЮЧЕНИЯ.
Весь обзор одним файлом


Отзывы читателей обзора Статистика в кардиологии. 15 лет спустя.

В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения.    

Н. Зорин. "Достоверность" или "статистическая значимость" - 12 лет спустя Изложены последствия неправильного употребления термина "достоверность" в российских медицинских публикациях. Даны рекомендации для исследователей и редакторов медицинских изданий по правильному и наиболее оптимальному употреблению упомянутых терминов и языка контекста.

Н. Зорин. О всё более полном удовлетворении растущих потребностей российского населения в оценке технологий здравоохранения. Часть I. Индустриальная модель медицины. Внедрение технологий. Проблемы терминологии.

Диссертационные войны. Как борьба с плагиатом в диссертациях переместилась из науки в политику

Балацкий Е.В. Диссертационная ловушка

МАТЕМАТИЧЕСКАЯ МОРФОЛОГИЯ.
ЭЛЕКТРОННЫЙ МАТЕМАТИЧЕСКИЙ И МЕДИКО-БИОЛОГИЧЕСКИЙ ЖУРНАЛ

Кунсткамера
Один из моих коллег по университету долгое время собирал коллекцию под названием "Бредотека". В ней он коллекционировал разнообразные примеры бредовых идей, сообщений и высказываний. Другие собирают аналогичные коллекции под названием "Абсурдотека". Свою коллекцию образцов статистической некорректности, а подчас и невежества, мы решили назвать "Кунсткамера".
Открыт зал экспонатов журнала "Бюллетень экспериментальной биологии и медицины". Подведены итоги конкурса на эпиграфы к этому разделу

Семинары по биометрике.
Центр БИОСТАТИСТИКА организуют выездные семинары по биометрике. В течение 10 дней читаются лекции и проводятся практические занятия на статистическом пакете. Семинар в Красноярске (28.01.2008 - 07.02.2008), летом 2007 г. в Якутске (28.05.2007 - 8.06.2007), весенний семинар в Якутске (18 - 28) 04. 2005, семинар в Иркутске (12 - 16) 02.2002, Самаре (19 - 24) 04.2004, Новокузнецке (17 - 22) 05.2004), Хинганском заповеднике (25.09 - 03.10) 2000. С предложениями об организации семинаров обращаться к редактору сайта (см. E-mail в нижней части страницы). ВАК-2007: новый председатель и старые проблемы. Кто кого? (Сокращённая версия статьи опубликована в "Независимой газете" от 11 июля 2007 г.)
Якутская биометрика-2007.
  Фоторепортаж о втором семинаре по биометрике в Якутске.Впечатления участников второго семинара по биометрике в Якутске.

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )



  Отзывы заказчиков по статистическому анализу данных

 

Систематические ошибки и вмешивающиеся факторы

Статья опубликована в Международном
журнале медицинской практики № 3 за 2007 г.

Измерения

Источником данных для анализа в любом исследовании являются результаты измерений и документы, в которых зарегистрированы такие результаты (лабораторные журналы, карты пациентов, отчеты больниц и т.д.). Исследователь регистрирует измерения в своих рабочих записях (журналах, формах) или в электронных формах (таблицах) на компьютере. Эти записи могут быть словесными (описательными), графическими (изображения, полученные техническими средствами — от фотографии до томограммы или зарисовки), цифровыми. Иногда уже по ходу наблюдения исследователь классифицирует свои наблюдения и вводит коды для наблюдаемых вариантов, например, для вариантов оволосения ушной раковины — буквенные. За кодом стоит соответствующая методика его получения.

Эта методика должна быть разработана и детально описана, чтобы другой специалист с аналогичной подготовкой мог повторить наблюдение (измерение) с теми же результатами. Например, мог точно так же оценить оволосение у пациента NN, как это сделал коллега 12 мес назад. Невоспроизводимые события не являются объектом науки, невоспроизводимые измерения не могут использоваться в научных целях. В действительности в любых измерениях всегда присутствует та или иная степень невоспроизводимости.

Компоненты вариабельности

Наблюдение и измерения у отдельных субъектов (в разных случаях) и у одного субъекта в разных условиях и в разное время приносят различающиеся результаты. Такие расхождения результатов измерений — не исключение, а фундаментальное правило, которое определяет технологию исследований в биологии и медицине. Полученные при повторных измерениях результаты становятся объектом статистического анализа. Совокупный вариационный ряд результатов измерений отражает сумму действия множества факторов.

Основной компонент общей вариабельности — аналитическая вариабельность, следствие неточностей работы приборов, дозировки реактивов и их загрязненности, ограниченной точности работы лаборантов. Обычно исследователь-врач не заинтересован в анализе происхождения этих отклонений от истинного значения измеряемой величины. Если врач работает в рамках научной организации, то он может быть более или менее уверен в мерах по контролю аналитической вариабельности, проводимых специалистами лабораторного отделения и техниками, ответственными за поверку измерительных приборов. Этот аспект работы, однако, никогда нельзя игнорировать: все измерения, представленные в отчете об исследовании, должны иметь ясную аналитическую характеристику (см. врезку).

Внутрииндивидуальная вариабельность колебания измеряемой величины у отдельных людей в разное время и в разных условиях. Эта вариабельность может мешать исследованию. Например, суточная вариабельность массы тела и концентрации глюкозы в плазме крови мешает измерить их «истинное» значение. Поэтому приходится определять условия, в которых измерение считается «правильным» (истинным), например измерение утром натощак. Помимо спонтанной суточной, недельной, годовой ритмики, помимо случайных изменений, связанных с диетой или работой, внутриииндивидуальная вариабельность включает изменения, связанные с заболеваниями и лечением. Поэтому внутрииндивидуальная вариабельность — основной объект медицинских исследований. Правильная методика исследования состоит в том, чтобы отделить случайные внутриииндивидуальные изменения от изучаемых и выделить их на фоне межиндивидуальных.

Межиндивидуальная вариабельность — это различия измеряемой величины между отдельными людьми. Эта вариабельность часто является объектом медицинских исследований, например, при описании проявлений болезни в сравнении со здоровьем или другими болезнями (Рис. 1)

Рис. 1 к статье В.В. Власова "Систематические ошибки и вмешивающиеся факторы".

Рис. 1. Соотношение внутрииндивидуальной, межиндивидуальной и аналитической вариабельности с изменениями при заболевании. Истинное мгновенное значение (1), например, концентрации вещества в крови у здорового человека натощак в постели (признак Х) при многократном измерении определяется с некоторым разбросом и отклонением результатов вследствие аналитической ошибки. Разброс соответствует случайной ошибке (2), а смещение от истинной величины (А) — систематической ошибке метода измерения. При измерении того же признака повторно в течение суток или месяцев обнаруживаются более широкие внутрииндивидуальные вариации (3). При этом типичное значение (среднее, модальное) отличается от однократно измеренного (В). В процессе развития заболевания признак изменяется (4), но на ранних стадиях болезни обычно находится в пределах межиндивидуальной вариабельности (6). Лишь при дальнейшем развитии болезни величина признака выходит за пределы типичных для популяции величин (5).

 

Свойства измерения
Правильность (accuracy, от лат. cura — забота, уход) — соответствие результата имерения истинному значению. Измерение или утверждение может отражать или представлять правильное значение без детализации. Показание термометра 36,60С является правильным, но не точным — более совершенный термометр покажет температуру в 36,6410С.

Точность (precision, от лат. praecidere — сокращать) — свойство быть строго определенным посредством точных деталей. Неверное измерение может быть выражено точно, но не являться правильным. Измерения должны быть и правильными, и точными, но эти два термина не являются синонимами.

Надежность (reliability, от лат. religare—- связывать) определяется как свойство быть неизменным и заслуживающим доверия. В медицине и эпидемиологии этот термин используют в таком же смысле. Результат измерений называется надежным, если он неизменен, т.е. повторение опыта или измерения дает один и тот же результат, в том числе в разных условиях измерения. Иногда как синоним употребляется термин состоятельность (consistency).

Термины повторяемость (repeatability) и воспроизводимость (reproducibility) — синонимы. Один из способов определения надежности измерения — его повторение. Неправильно этими терминами подменять термин надежность, т.е. существительное, относящееся скорее к процедуре измерений, а не к измеряемому признаку. Неточный метод может давать воспроизводимые результаты, как при сбитом прицеле стрельба дает кучное расположение пробоин в стороне от яблочка.

Достоверность (validity, валидность): если какой-либо тест измеряет именно то, что он подразумевает измерить, то такой тест называется достоверным.  Этот термин употребляют не только применительно к результатам измерения, но и к результатам клинических исследований. Это справедливо, поскольку само исследование есть способ измерения, например, действенности лекарственного средства или диагностической точности томографии.

С терминами, описывающими свойства измерений — правильность, точность, достоверность, надежность, повторяемость и воспроизводимость — нередко возникает путаница. Так, правильность и точность часто используются как синонимы; достоверность определяется по-разному; надёжность, повторяемость и воспроизводимость часто используются как взаимозаменяемые термины.

При анализе совокупности данных исследователь имеет дело c результатами измерений, в которых проявились все компоненты вариабельности, и на первом плане, конечно, стоит самая широкая из них, межиндивидуальная вариабельность. Исследователь должен построить исследование так, чтобы изучаемый компонент вариабельности был максимален, а другие компоненты вариабельности — минимальны. Тогда на фоне прочих вариаций можно увидеть, например, различие между здоровыми и больными.

В медицинских исследованиях всегда стремятся уменьшить аналитическую вариабельность. Высокая аналитическая вариабельность, зависящая от непонятных причин или от различий в работе лаборантов, может приводить к тому, что разница результатов у двух пациентов будет объясняться не различиями их состояния здоровья, а тем, что пробы обрабатывали разные лаборанты. Один из самых надежных способов уменьшить влияние случайной ошибки — выполнение повторных измерений и усреднение результата. Для того чтобы этот способ надежно сработал, надо, чтобы отдельные измерения выполнялись независимо. Если повторные измерения проводит один оператор (лаборант) одно вслед за другим, то эти измерения не вполне независимы,  они все находятся под влиянием особенностей этого оператора и у любого оператора имеют свойство «согласовываться» между собой.

При изучении внутрииндивидуальных изменений нужно помимо аналитической подавить межиндивидуальную вариабельность.  Пример — изучение изменения некоторого признака в процессе заболевания или беременности. Для сокращения межиндивидуальной вариабельности из изучаемой группы пациентов исключают тех, кто резко отличается от прочих (например, имеет тяжелое сопутствующее заболевание), проводят измерения в стандартных условиях, применяют коррекцию известных межиндивидуальных различий (например, применяют для измерения артериального давления манжетки различной ширины в зависимости от диаметра плеча). Чтобы внутрииндивидуальные изменения были больше и лучше выявлялись в исследовании, выбирают пациентов с благоприятными для исследования характеристиками. Например, при изучении эффективности медицинских вмешательств подбирают:

  • пациентов, у которых в предварительном испытании выявляется хорошая реакция на препараты изучаемой группы;
  • пациентов, которые правильно выполняют назначения (это свойство пациентов называют исполнительностью или комплайенсом – от англ. compliance);
  • пациентов с большей тяжестью болезни, поскольку у таких пациентов величина изменений под влиянием лечения обычно бывает больше.

С этой же целью силу воздействия (дозу) выбирают достаточно большую, чтобы вызвать заметные изменения.

При изучении межиндивидуальных различий помимо уменьшения аналитической вариабельности нужно уменьшить внутрииндивидуальную. Пример — изучение диагностических тестов, вариантов заболевания. Для уменьшения внутрииндивидуальных вариаций проводят измерения в стандартизованных условиях, например, дают пациентам отдых перед измерением, и учитывают при анализе данных сопутствующие факторы, например, интенсивность курения или физические нагрузки, испытываемые обследуемым.

Cущество правильной организации исследования состоит в том, чтобы сделать изучаемый компонент вариабельности максимальным, а другие слагаемые общей вариабельности свести к минимуму. Суть статистического анализа заключается в соотнесении величины изучаемого компонента вариабельности с величиной прочих компонентов вариабельности. Например, при анализе размера внутрииндивидуальных изменений (до и после лечения) их сопоставляют с межиндивидуальными вариациями. Если это отношение велико, то статистические критерии подтвердят гипотезу исследователя. Наоборот, в случае, когда исследование спланировано так, что изучаемый компонент вариабельности мал сравнительно с межиндивидуальными различиями обследованных субъектов и аналитическими вариациями, то исследователь не сможет выделить этот «полезный сигнал» из «шума» мешающих вариаций. Например, годовой ритм артериального давления может быть не виден на фоне больших различий между людьми.

При изучении межиндивидуальных различий помимо уменьшения аналитической вариабельности нужно уменьшить внутрииндивидуальную. Пример — изучение диагностических тестов, вариантов заболевания. Для уменьшения внутрииндивидуальных вариаций проводят измерения в стандартизованных условиях, например, дают пациентам отдых перед измерением, и учитывают при анализе данных сопутствующие факторы, например, интенсивность курения или физические нагрузки, испытываемые обследуемым.

Cущество правильной организации исследования состоит в том, чтобы сделать изучаемый компонент вариабельности максимальным, а другие слагаемые общей вариабельности свести к минимуму. Суть статистического анализа заключается в соотнесении величины изучаемого компонента вариабельности с величиной прочих компонентов вариабельности. Например, при анализе размера внутрииндивидуальных изменений (до и после лечения) их сопоставляют с межиндивидуальными вариациями. Если это отношение велико, то статистические критерии подтвердят гипотезу исследователя. Наоборот, в случае, когда исследование спланировано так, что изучаемый компонент вариабельности мал сравнительно с межиндивидуальными различиями обследованных субъектов и аналитическими вариациями, то исследователь не сможет выделить этот «полезный сигнал» из «шума» мешающих вариаций. Например, годовой ритм артериального давления может быть не виден на фоне больших различий между людьми.

 

Систематическая ошибка

Часто исследование проводится с использованием не самого точного из существующих метода, позволяющего получить наиболее близкое к истинному значение измеряемой величины, поскольку такие референтные методы (дающие эталонное по точности измерение) обычно трудоемки, опасны, болезненны или дороги. Отклонения результатов измерения от истинного значения являются ошибками (погрешностями) измерения независимо от причины отклонения. Случайная ошибка — отклонения от истинной величины, которые в среднем равны нулю, т.е. не изменяют измеряемой величины (Рис. 1, 2). Случайная ошибка затрудняет выявление закономерностей, но ее наличие не сказывается на направлении и величине сдвигов (различий, связей), выявляемых в исследовании, конечно, при условии, что проведено множество измерений. Систематической ошибкой (СО, смещением, bias, англ.) называют смещение среднего результата измерения по отношению к истинной величине ( см. Рис. 1, В). Например, из-за особенностей применяемых реагентов разные способы измерения концентрации отдельных веществ в крови (например, тропонина или глюкозы) дают несколько различные результаты.

Всякое отклонение выводов от истины или процесс, приводящий к подобному отклонению, называют СО. Так же обозначают любое уклонение (искажение) в сборе, анализе, интерпретации, публикации или обзоре данных, ведущее к выводам, которые систематически отличаются от истины [1]. Основные механизмы возникновения смещений следующие.

1. Систематическое (одностороннее) отклонение результатов измерений от истинных величин (СО в узком смысле, «СО измерения»).

2. Отклонение суммарных статистических оценок (средних, частот, мер связи и т.д.) от их истинных значений в результате систематического отклонения результатов измерений, других погрешностей в сборе данных или погрешностей в дизайне исследования, анализе данных.

3. Отклонения выводов от истины в связи с недостатками дизайна исследования, сбора данных, анализа или интерпретации результатов.

4. Тенденция процедур (в дизайне исследования, при сборе данных, анализе, интерпретации, обзоре или публикации результатов) давать результаты или выводы, отклоняющиеся от истины.

5. Предубеждения, заставляющие сознательно или неосознанно выбирать такие процедуры исследования, которые ведут к отклонению от истины в определенном направлении или к односторонней интерпретации результатов.

Исследователи стремятся получать в исследованиях несмещенные оценки, но это не всегда возможно, и в таком случае исследователь должен оценивать возможную величину смещения. Термин СО (смещение) не обязательно предполагает обвинения в предубежденности или наличии другого субъективного фактора, такого как желание получить определенный результат.  Смещённая оценка может быть лишь следствием несовершенства дизайна исследования или какого-то его элемента.

 

Разновидности систематических ошибок

Описано множество разновидностей СО. Приводимый ниже список неполон. Он предназначен для того, чтобы проиллюстрировать разнообразие на примерах наиболее изученных и распространенных СО. Назвать какие-то СО более важными нельзя, потому, что появление в исследовании любой из них может приводить к серьезным последствиям, таким как обнаружение преимущества нового метода лечения перед старым или, наоборот, невозможность выявить важное преимущество одного способа лечения или диагностики перед другим.

Незнание возможных СО может приводить к ошибкам (или подталкивать к умышленному использованию этих СО [2]), а потому СО надо учиться распознавать даже тем, кто не собирается проводить исследования. Умышленные или неумышленные смещения в оценках методов диагностики и лечения — основная причина, по которой некоторые бесполезные методы считаются полезными, а полезные методы не используются, поскольку оцениваются как бесполезные или вредные.

 

Ошибки выборки

СО выборки (sampling bias) — СО, возникающая в результате изучения неслучайной выборки. Ее не следует путать с ошибкой выборки (sampling error), которая является частью общей ошибки оценки параметра, возникающей из-за случайного характера выборки. Ошибка выборки случайна, она возникает как проявление того, что каждая случайная выборка из популяции отличается (вариабельность выборочных результатов, sampling variation).

Ошибка обращаемости (ascertainment bias) — СО, связанная с включением в исследуемую выборку лиц или случаев, не представляющих равным образом все классы (подгруппы) популяции. Причины этой СО разнообразны. Это может быть особенность источника, откуда поступают обследуемые лица, например, поликлиника завода (в результате выборка не будет отражать состояние здоровья населения).Это может быть способ выявления людей, их особенностей, в частности диагнозов, на который могут влиять обычаи и культура. 

СО отбора (selection bias) — ошибка, вызванная систематическими различиями характеристик у тех, кто принимает участие в исследовании и теми, кто в нем не участвует. Такая ошибка возникает в исследовании, в которое включают только добровольцев (они отличны от тех, кто не пожелал участвовать) или только госпитализированных пациентов, находящихся под наблюдением врача (исключены те, кто умер до госпитализации из-за тяжелого течения заболевания, и те, кто еще недостаточно болен для того, чтобы нуждаться в госпитализации, и те, кто из-за стоимости лечения или расстояния не был госпитализирован). В результате СО отбора могут возникать ложные связи и замаскировываться реально существующие. СО отбора — очень частая проблема, многообразная в своих проявлениях.[3,4]

СО отклика (response bias) — СО, вызванная различиями в характеристиках тех, кто добровольно вызвался принять участие в исследовании, и тех, кто отказался.

СО вследствие выбывания из исследования (bias due to withdrawals) — СО, возникающая вследствие различия между величинами истинными и величинами, полученными в исследовании, в результате особенных характеристик участников, вышедших из исследования. Например, при изучении катамнеза не удается найти часть больных. Изучение характеристик только тех, кого удалось найти, может давать искаженное представление даже о таких показателях, как смертность.

СО серии вскрытий (bias in autopsy series) — СО в оценке патологоанатомической картины, возникающая в результате того, что вскрытые умершие являются нерандомизированной выборкой из всех смертных случаев. Например, при анализе текущих результатов патологоанатомических вскрытий нельзя не учитывать, что патологоанатомы изучают только половину умерших. Возможно, что в «невидимой» половине и структура причин смерти, и частота расхождений с клиническим диагнозом иные.

СО распределения пациентов (allocation bias) — в экспериментальных исследованиях методов лечения возможно неравное распределение пациентов между сравниваемыми группами, в результате, например, сравнивается частота или скорость выздоровления у «легких» больных, получающих новое вмешательство, с  аналогичными признаками у более тяжелых больных, получающих стандартное лечение.

 

Ошибки измерения

СО инструментального измерения (bias due to instrumental error) — СО, возникающая вследствие недостатка измерительного прибора, дефектов его калибровки, использования недоброкачественных реактивов, неправильных технологий измерения и т.д.

Феномен предпочтения чисел (digit preference) — предпочтение определенных чисел, обычно приводящее к округлению измерений. Округление может производиться до ближайшего целого числа, дробного числа, кратного 5 или 10, а при других единицах измерения — соответственно им, например, при измерении неделями — 7, 14 дней, при оценке интенсивности курения – до 20 (пачки, Рис. 2) и т.д. Предпочтение чисел может быть свойством лица, отвечающего на вопросы в обследовании, или формой ошибки наблюдателя. Например, курильщики на вопрос о количестве выкуриваемых сигарет бессознательно округляют до 5, так же поступают обычно врачи, регистрируя результаты измерения артериального давления.

Рис. 2 к статье В.В. Власова "Систематические ошибки и вмешивающиеся факторы".

Рис. 2. Распределение курильщиков (ордината, %) по числу выкуриваемых в день сигарет. Данные любезно предоставлены Я. Балабановой.

СО представления данных (bias in the presentation of data) — ошибка в результате неоднородностей, вызванных предпочтением чисел, неполнотой данных, некачественными лабораторными процессами, плохими методами измерения.

СО информации (information bias, син.: observational bias — СО наблюдения) — в результате погрешностей в процедуре наблюдения или оценки в сравниваемых группах могут возникать разные ошибки, и, соответственно, может возникнуть (или быть скрыто) различие между группами или зависимость.

СО интервьюера (interviewer bias) — СО, возникающая, когда человек, проводящий опрос, подсознательно или сознательно избирательно регистрирует неполную или искаженную информацию . Это может быть следствием того, что интервьюер не владеет языком опрашиваемых, имеет предрассудки, а также иными причинами.

СО наблюдателя (observer bias) — систематическое различие истинных значений и наблюдаемых результатов, из-за ошибки наблюдателя. Человек не только использует инструменты, но и сам в жизни и в исследовании выступает как инструмент в оценке времени, определении момента возникновения явления, наличия явления (например, тени, осадка, кристаллов). В этом качестве человек дает результаты, в которых обязательно присутствует случайная ошибка. Последнюю называют ошибкой наблюдателя (observer variation, observer error). Наличие ошибки наблюдателя часто недооценивается. Между тем, общее правило гласит, что все наблюдения подвержены вариациям, и всегда следует ожидать, что будут иметься расхождения между повторными наблюдениями одного исследователя и расхождения между исследователями.

Вариации можно уменьшить, но полностью их избежать невозможно. Причины ошибок наблюдателя бесконечны. Исследователь может не заметить отклонение или думать, что обнаруженного не существует; измерение или тест могут дать неверные результаты из-за ошибочного метода или неверного прочтения и записи данных; исследователь может неверно интерпретировать образ или наблюдение.  Выделяют две разновидности ошибки наблюдателя: вариации результатов исследователей (interobserver variation, т.е., различия результатов измерений разными исследователями) и вариация результатов одного исследователя (intraobserver variation, т.е. различия результатов в серии измерений одного и того же объекта, проделанной одним исследователем).

Всю совокупность ошибок наблюдателя (случайную и систематическую ошибки) можно в значительной степени устранить, если измерения проводить параллельно и независимо двумя или более исследователями. Поскольку ошибки исследователей в основном независимы, то расхождения измерений (оценок) укажут на такие ошибки. Эти ошибки станет возможным устранить, для чего существуют разные методы, из которых простейший — вычисление средней оценки. Возможно возникновение специфической СО наблюдателя (или СО измерения) в оценке методов лечения. Если при тяжелом заболевании испытывается новый способ лечения в открытом эксперименте,  пациенты, получающие новое (дорогое или недоступное другим) вмешательство, могут выше оценивать результаты лечения в сравнении с пациентами контрольной группы, получающими стандартное вмешательство.

СО памяти (recall bias) — СО, возникающая вследствие различия в точности или полноте воспоминаний о прошлых событиях или жизненном опыте. Например, больной человек лучше, чем здоровый, может вспомнить события, потенциально связанные с возникновением заболевания [5].

СО сообщения информации пациентом (reporting bias) — СО вследствие выборочного сообщения или сокрытия информации о прошлой истории болезни, например, о деталях половой жизни. Обычно эта СО проявляется в сокрытии общественно осуждаемых форм поведения и может возникать не только при изучении пациентов, людей в популяции, но и при изучении поведения врачей.

СО в обращении с выпадающими величинами (bias in the handling outliers) — СО, возникающая вследствие включением в анализ необычных (выпадающих из общего ряда) значений в маленькой выборке или же вследствие исключения из анализа необычных значений, которые следовало включить.

 

Ошибки дизайна и анализа

СО опережения (lead time bias, син. zero time shift — сдвиг точки отсчета). Обычным в медицинской практике является стремление к выявлению заболевания ранее обычного  (интервал опережения, lead time), например, до возникновения симптомов.  Предполагается, что лечение в этом случае будет более успешным, и это увеличит выживание. Если выживание измеряется временем от выявления болезни до смерти, то ранняя диагностика может создавать иллюзию увеличения выживания за счет того, что болезнь будет просто выявляться раньше, т.е. возникает переоценка времени выживания из-за сдвига назад точки отсчета выживания (Рис. 3). Для надежного выявления истинного характера увеличения длительности выживания после диагностики необходимы сравнительные экспериментальные исследования. В более общем случае СО опережения  возникает, когда наблюдения за группами пациентов  начинаются на несравниваемых стадиях естественного развития заболевания. Например, вмешательства у женщин, страдающих раком молочной железы, который выявляется путем скрининга, нельзя сравнивать с вмешательствами у женщин, болезнь которых выявляется клиническим осмотром при обращении на более поздней стадии болезни.

Рис. 3 к статье В.В. Власова "Систематические ошибки и вмешивающиеся факторы".

Рис. 3. Происхождение СО опережения. При обычной диагностике заболевание, возникшее в 1998 г., выявляется в 2005 г. и приводит к смерти в 2007 г. При ранней диагностике заболевание будет выявлено в 2002 г. (интервал опережения 3 года). При сохранении той же продолжительности жизни период выживания после выявления болезни увеличивается на 2 года за счет сокращения периода жизни «без диагноза».

СО продолжительности (length bias) — СО, возникающая при изучении болезни на выборке преваленсных случаев (всех случаев, найденных в популяции или в регистре. В такой выборке оказываются преимущественно представлены длительно текущие случаи. СО продолжительности может возникать не только в поперечном исследовании, но и в когортном по ретроспективно собранным данным, в исследовании типа сравнения с контролем и других [6].

Рис. 4 к статье В.В. Власова "Систематические ошибки и вмешивающиеся факторы".

Рис. 4. Возникновение СО продолжительности. при изучении преваленсных случаев. В любой момент Т времени Х однократное обследование популяции выявит преимущественно длительно текущие случаи заболевания (длинные линии), а короткие пропускаются.

СО дизайна (design bias) — различие между истинной величиной, например, величиной эффекта ЛС, и величиной, полученной в результате неправильного дизайна исследования. Например, в неконтролируемом исследовании терапевтического эффекта ЛС может быть невозможно отличить влияние на исход болезни ЛС и более высокого дохода у тех, кто мог оплатить это ЛС. В некоторых случаях, применительно к отдельным особенностям дизайна их влияние на оценку исхода известно (это называют «эффект дизайна»). Например, если требуется изучить влияние правил ведения больных врачом на исходы, то не совсем правильно предложить врачу вести больных разными способами (опытную группу — так, а контрольную — иначе). При этом все больные неизбежно начинают получать некое «усредненное» лечение.

Правильнее рандомизировать врачей, и тогда больные одного врача будут получать одно лечение, а больные другого — другое. Это называется кластерным дизайном . При кластерном дизайне выявляемый эффект (разница в исходах при двух вмешательствах) больше, но для достижения статистической значимости эффекта необходимо больше пациентов, чем было бы необходимо при обычном дизайне (параллельном, простая случайная выборка) и равной величине эффекта. Это отличие в результатах исследования, зависящее от особенностей дизайна, называют эффектом дизайна. Отдельные дизайны более, чем другие, подвержены ВВФ. Так, в исследованиях сравнения с контролем и обсервационных исследованиях ВВФ больше и спектр возможных смещений шире, чем в экспериментальных исследованиях типа двойных слепых контролируемых испытаний.[7] СО дизайна не следует путать с подверженностью отдельных дизайнов разным систематическим ошибкам. Например, описания серии случаев и исследования типа сравнения с контролем, сравнения с историческим контролем и с географическим (внешним) контролем подвержены широкой гамме СО. В сравнении с этими дизайнами проспективные контролируемые испытания, в особенности рандомизированные слепые испытания, лучше защищены от возникновения СО, поскольку в этот дизайн встроены несколько механизмов защиты от возможных СО.

Ошибка Берксона (Berkson's bias, Berkson's fallacy) — разновидность СО отбора, которая возникает из-за того, что в исследовании типа случай-контроль исследуемые и контрольные лица систематически отличаются друг от друга. Например, так происходит случаях, когда изучаемая экспозиция (воздействие) повышает риск госпитализации при данной болезни, а не риск болезни. Это систематически приводит к повышению частоты экспозиции у госпитализированных больных по сравнению с пациентами контрольной группы, также находящимися в стационаре; в свою очередь, это увеличивает отношение шансов.  Например, если у летчиков обнаружение изменений позвоночника приводит к обязательной госпитализации, а у других авиационных специалистов — обычно к амбулаторному обследованию, тогда сравнение летчиков в стационаре с другими пациентами выявит связь профессии с изменениями позвоночника.

СО выявления (detection bias) — СО в результате систематической погрешности в методах выявления, диагностики или верификации случаев в исследовании. Например, больные, отобранные для исследования в первичной практике, отличаются от отобранных в больнице, поскольку в последней доступны специальные лабораторные тесты. Вариант: СО спектра патологии [8]. При исследовании нового диагностического теста его точность в выявлении патологии может выглядеть высокой. В действительности это успешное выявление больных, например, раком простаты, может быть связано с тем, что контрольную группу составляли студенты-медики, а группу больных — больные с диагнозом, верифицированным на операции. Как только метод будет применен в группе пожилых мужчин для выявления относительно ранних случаев рака, может оказаться, что его возможности в выявлении больных невелики.

СО диагностической проработки (workup bias) — СО, вызванная неверным или неполным выявлением случаев, более частым в одной группе исследования. Обычно это происходит потому, что пациенты с положительным результатом первого теста, используемого вначале, получают более тщательное обследование при дальнейшей диагностике, чем те пациенты, у которых результат первого теста был отрицательным. При сопоставлении заболеваемости в профессиональных группах эти группы могут иметь различный доступ к диагностическим технологиям.

СО предположения (bias in the assumption, cин. conceptual bias — концептуальная ошибка) — ошибка в результате неверной логики. Ложные выводы об объяснениях ассоциации между переменными. Неоднократно документировано, как исследователь переносит на новый объект концепции, оказавшиеся плодотворными в предыдущем исследовании.

СО интерпретации (bias of interpretation) — СО в выводе и толковании. Возникает вследствие ограниченной возможности исследователя рассмотреть все возможные интерпретации, соответствующие фактам, и оценить достоинства каждого из них или вследствие пренебрежение случаями, которые представляют собой исключения из общего вывода.

Феномен регрессии к средней,который проявляется во всех продольных исследованиях. Вследствие действия случайных факторов аналитического происхождения и вследствие временных изменений в состоянии людей (например, легкое инфекционое заболевание), получаемые при измерении величины могут быть завышены, занижены, или соответствовать долговременным (постоянным) индивидуальным особенностям. Происхождение регрессии к средней следующее. Если величина, измеренная в первый раз, не была существенно смещена вследствие аналитических или внутрииндивидуальных вариаций, то при следующем изменении она изменится непредсказуемо, в среднем для таких субъектов не изменится никак. Если же величина была завышена, то она в следующий раз будет примерно средней, т.е. приблизится к средней относительно первого значения. Чем более она была завышена (например, вследствие большой аналитической ошибки), тем больше она сдвинется к средней, типичной для популяции величине. В случаях, где наблюдалась заниженная вследствие аналитических и внутрииндивидуальных колебаний величина, тоже будет сдвиг к средней — повышение. Если бы имели место только аналитические вариации, то регрессия к средней полностью реализовывалась бы при втором измерении. Поскольку внутрииндивидуальные вариации могут быть долгосрочными, постольку возврат к средней, например, после болезни или после изменения образа жизни в связи со сменой работы, может занимать месяцы и годы.

Экологическая ошибка (ecological fallacy). Для выявления связи экспозиции и заболевания можно сопоставлять экспозицию у отдельных людей с возникновением у них болезней, а можно сопоставлять экспозицию популяций (стран) с заболеваемостью в этих странах. Исследования второго типа называют экологическими. На основании связи между национальным потреблением соли и  распространенностью язвенной болезни желудка и двенадцатиперстной кишки в большом числе стран можно предположить наличие между этими явлениями причинной связи. Можно далее сделать выводы относительно необходимых мер профилактики. Это было бы типичной экологической ошибкой — перенесением на возникновение болезней у отдельных людей закономерностей, полученных в экологических исследованиях. Множество связей, найденных в экологических исследованиях, не были подтверждены на индивидуальном уровне. Противоположная ошибка — перенос на уровень популяции закономерностей, изученных на отдельных людях (атомистическая СО).

 

Ошибки в обнародовании результатов исследований

Специалисты и публика, использующие медицинскую и иную научную литературу, склонны рассматривать ее как совокупность относительно объективных научных сообщений, которые в большей или меньшей степени точно отвечают на поставленные вопросы. Это расхожее представление соответствует предположению о том, что научные статьи могут содержать ошибочную информацию с элементом случайной ошибки. В действительности истина, открывающаяся в научных исследованиях, отражается в публикациях не только со случайно ошибкой, но и с рядом СО. Эти ошибки в совокупности называют СО обнародования (по-английски используется термин reporting bias, который относится также к ошибке сообщения информации пациентом). В целом СО обнародования создают медицинским научным журналам специфический облик витрины непрекращающихся сообщений об успехах в диагностике и лечении.

Главная из ошибок обнародования —  публикационная СО (publication bias) [9,10]. В основном она состоит в том, что не все результаты исследований публикуются (обнародуются). Публикуются чаще те исследования, которые принесли положительные результаты, т.е., в выгодном свете представляют новое лечение. Эта проблема не только медицинских исследований, она характерна для всей человеческой деятельности (см. видеоиллюстрацию из Monty Python’s на YouTube: http://www.youtube.com/watch?v=7l_jkRQ4vJs). СО обнародования присуща не только результатам экспериментальных исследований, но и всех других. Везде, где есть хоть какой-то стимул для разного отношения исследователя или спонсора к разным результатам исследования, возникают систематические ошибки. Исследователь работает, в той или иной мере отдавая предпочтение рабочей гипотезе. Если она не подтверждается, то это ведет к разочарованию, потере интереса к опубликованию. Опубликование статьи  — это трудный процесс, и нужно хотеть, чтобы оно состоялось [11]. Неопубликование данных исследования — не просто нарушение принципов научного поиска. Это может быть опасным. Так, в 80-х годах ХХ века группа авторов исследовали антиаритмическое ЛС. В группе пациентов, которые его получали, обнаружилась высокая летальность. Авторы расценили это как случайность, и, поскольку разработка этого антиаритмического ЛС была прекращена,  то публиковать материалы не стали. Позднее подобное антиаритмическое ЛС — флекаинид — стало причиной гибели множества людей [12].

Система, в которой работает исследователь, может подталкивать к обнародованию только положительных результатов. Например, русская диссертационная система не принимает «отрицательных» результатов. В 2004 г. МЖМП опубликовал призыв сообщить о прецеденте защиты диссертации с отрицательным выводом по основному положению, но, несмотря на обещание премии, так ни одного сообщения и не получил. Но самый важный фактор, определяющий отказ от обнародования — интересы спонсора. Классический пример — отказ от опубликования результатов фармацевтическими компаниями в случае, когда исследование приносит отрицательный результат. Наоборот, положительный результат, хорошо отражающийся на продажах, может многократно повторно публиковаться [13]. Этот механизм, конечно же, характерен не только для фармацевтических компаний. Производители оборудования ведут себя таким же образом. Производители табака точно так же финансируют исследования и публикуют избирательно то, что им выгодно [14,15]. СО обнародования не относится только к контролируемым испытаниям. Она присутствует в исследованиях всех дизайнов.

Для отдельно взятого читателя, знакомящегося с отдельно взятой статьей или несколькими статьями, наличие публикационной СО незаметно, как незаметны микроорганизмы на коже. Трудно представить, что статья, на чтение которой ты нашел время, оказалась перед твоими глазами не потому, что она важна, а потому, что спонсор потратил средства на ее повторное опубликование, на напечатание отдельных оттисков, раздаваемых на конференции бесплатно, на гонорар профессору, который эту статью упомянул в лекции. Именно поэтому на первом месте у врача должен быть поиск защищенной от СО информации, прежде всего — систематических обзоров. Точно так же у исследователя на первом месте должна быть не работа с «образцом» какого-то предшествующего исследования, а работа с совокупностью предшествующих данных. Поэтому каждый исследователь на этапе планирования работы должен выполнить систематический обзор предшествующих исследований по изучаемому вопросу.

Помимо основного фактора — результата исследования — на вероятность опубликования влияют и иные факторы.

Языковое смещение. По понятным причинам исследования, исходящие из англоязычных стран Запада, легче находят путь на страницы ведущих международных англоязычных журналов. С этой СО тесно связана СО финансирования — исследования, имеющие существенное финансирование, публикуются чаще, чем исследования инициативные, не финансируемые извне. Здесь имеет значение не только фактор обязательств исследователя перед спонсором, но и ограниченность собственных средств исследователя. Последний может найти время для инициативного исследования, но, получив «отрицательный» результат, не найти более времени для того, чтобы трудиться над его опубликованием. Близка к языковой и «СО развивающихся стран» — известная трудность для исследователей из развивающихся стран опубликоваться в международных журналах. Интересно, что в основе этой СО лежит недоверие редакторов к исследованиям из развивающихся стран. Это не мешает периодической публикации в лучших журналах одиозных фальсифицированных исследований из этих стран [16] или плагиата [17].

Сами авторы оказывают влияние на то, какие исследования, будучи обнародованными, присутствуют в обороте. Например, статья из провинциального русского журнала, будучи процитированной в другой статье, опубликованной в международном журнале, включается в научный оборот. Если этого не произойдет, то статьи из журнала, не индексируемого в международных базах данных, останутся вне мирового научного оборота.

Исследователь, выполняющий систематический обзор, также может внести СО в его результаты. Поэтому систематические обзоры также должны оцениваться читателями критически. Прежде всего, такая ошибка возникает за счет манипулирования критериями включения и исключения исследований из обзора. Этим широко пользуются сегодня производители ЛС, оборудования, предметов ухода для того, чтобы с помощью систематического обзора показать преимущество своего продукта. Самый известный пример — спонсирование производителями альбумина обзора с результатами, отличающимися от обзора, показавшего неэффективность инфузий альбумина при тяжелой травме [18,19].

СО отсрочки публикации. Все исследования, имеющие меньшие шансы на опубликование, одновременно еще и позднее публикуются. В целом, чем менее «поразителен» результат, чем меньше он нужен спонсору и самому исследователю, тем позднее он публикуется. Для инициативных исследований отсрочка в опубликовании может составлять многие годы.

СО сообщаемого исхода (outcome variable selection bias). В зависимости от интересов исследователя и по иным причинам в опубликованных отчетах могут фигурировать в первую очередь те изученные признаки, которые наиболее привлекательны, лучше приемлемы для «передового» журнала, или лучше подтверждают интересы спонсора. Например, в медицине вполне обычно опубликование результатов исследования с позитивной оценкой некоего вмешательства на основании только измерения толщины интимы артерии или изменения концентрации отдельных липопротеидов, в то время, как клинически важные исходы могут не сообщаться, сообщаться не полностью, или сообщаться в более поздних публикациях. Обычно это связано с тем, что в значительной части исследований удается обнаружить «интересные» изменения в биохимических параметрах, но не в смертности, качестве жизни, инвалидности больных.

 

Вмешивающиеся факторы

Организация медицинского исследования трудна прежде всего потому, что изучаемый признак, например длительность ремиссии, зависит от множества факторов помимо того, который изучает исследователь. Некоторые из этих привходящих факторов (вмешивающихся, confounders, англ.от лат. confundere, смешивать) хорошо известны, и их легко учесть. Например, при сравнении смертности среди шахтеров и священников для проверки предположения, что тяжелый труд сопровождается высокой смертностью, обнаруживается, что смертность выше у священников. Причину легко понять — священники значительно старше шахтеров. Поскольку это понятно, исследователь может сравнить смертность у шахтеров и священников равного возраста или сделать поправку на возраст (стандартизацию по возрасту). В результате выясняется, что, конечно же, смертность выше среди шахтеров; вмешивающийся фактор (ВФ) — возраст.

В других случаях ситуация оказывается сложнее. Например, у рабочих химических производств, связанных с экспозицией опасным веществам, можно ожидать повышенной по сравнению с популяцией смертности. Однако при попытке исследовать общую смертность в таких профессиональных группах обычно обнаруживается, что смертность в них ниже, чем в популяции. Оказывается, что, поскольку работники, в особенности работники вредных производств, отличаются лучшим здоровьем, чем в среднем в популяции, смертность среди них ниже (эффект здорового работника).[20] Можно лишь предполагать, что их условия труда вредны и приводят к повышению смертности, но это повышение смертности не превышает имеющейся разницы с популяцией. Не существует способа проверить, повышается ли смертность и насколько [21-23]. Из этого примера понятно, почему ВФ называют еще модификаторами эффекта (effect modifiers).

В общих чертах влиянием вмешивающихся факторов (ВВФ) называют любую ситуацию, в которой помимо изучаемого фактора (экспозиции) на исход действует один или более других, и влияние этих факторов не разделяется [24]. Основным механизмом возникновения ошибки в результате действия ВФ является его связь как с действующим фактором (экспозицией), так и с изучаемым исходом. В первом примере возраст различается в двух профессиональных группах и одновременно влияет на смертность. Во втором примере состояние здоровья влияет на включение людей в профессиональную группу и одновременно— на смертность. Вмешивающийся фактор должен обязательно быть связан как с экспозицией, так и с исходом.

Само искажение видимого эффекта экспозиции, вносимое ее связью с другими факторами, которые могут влиять на исход, также называют ВВФ (конфаундингом). Соотношение между влияниями двух и более причинных факторов, нередко наблюдаемое в наборе данных, в котором логически невозможно разделить вклады отдельных причинных факторов, также называют ВВФ. Внешний фактор — это не звено в цепи причинной связи экспозиции и исхода, а именно отдельно действующий фактор, связанный как с экспозицией, так и с исходом.

Никогда нельзя исключить присутствие ВФ и предположение, что обнаруженная зависимость или различие объясняются действием ВФ. При получении неожиданного результата первой попыткой его интерпретации должен быть поиск возможных ВФ. Обычно ВВФ имеет не очень большое влияние, т.е. не приводит к появлению зависимостей с отношением шансов (ОШ) выше 2, но нельзя только на этом основании утверждать, что связь, например употребления пива с димедролом и импотенции при ОШ 2,3 — причинная. Всякий анализ результатов исследования в отношении потенциального объяснения результатов ВВФ должен быть конкретным, т.е. указывать на потенциальный фактор (экспозицию, признак), способные объяснить обнаруженную связь. Если такая гипотеза выглядит правдоподобной, то далее исследователь может выполнить другое исследование, в котором влияние данного ВФ будет устранено. Влияние возраста в приведенном примере сравнения священников и шахтеров легко учесть, но внести поправку можно не всегда. В случае с работниками вредного производства размер ВВФ неясен, и неизвестно, как можно было бы скорректировать это влияние экспериментальным путем или внесением расчетных поправок. В целом внесение поправок (adjustment) не полностью или, наоборот, избыточно изменяет полученную связь. В некоторых случаях внесение поправок может приводить к возникновению новых ошибок (ложных связей) [25].

Правильно спланированное исследование позволяет устранить ВВФ или скорректировать его (как в примере с использованием поправки на возраст для оценки смертности). Для того чтобы это было возможно, исследователь должен хорошо знать объект исследования и постоянно ожидать возникновения ошибок. Не будет большим преувеличением сказать, что подготовка ученого, методологическая и в предметной области, состоит прежде всего в подготовке к выявлению ВВФ. Если ВВФ остается невыявленным, то результат исследования оказывается смещенным. Такая СО, вызванная присутствием ВФ, связанного, как с воздействием, так и с его исходом, называется ошибкой конфаундинга или ВВФ.

ВВФ называют негативным, если оно затеняет или ослабляет изучаемую закономерность. Так, негативным оказывается влияние отбора по состоянию здоровья на выявляемый вред здоровью от работы на вредном производстве. Позитивным называют ВВФ, усиливающее изучаемую зависимость или увеличивающее выявляемое различие. В медицинских исследованиях некоторые разновидности ВВФ привлекают особое внимание, поскольку способны привести к серьезным ошибкам в исследовании. Прежде всего это конфаундинг показания (confounding by indication, англ.) — искажение влияния лечения на исход болезни, вызванное наличием симптома, который может быть связан как с лечением, так и с исходом; либо искажение влияния лечения на исход болезни при наличии показания или противопоказания к данному лечению, которое также связано с исходом[26]. Такое искажение не может возникнуть в контролируемом испытании, оно возникает при анализе результатов лечения. Если некоторое лекарственное средство (ЛС) назначается чаще при наличии определенного симптома, то обнаруженная связь применения ЛС и исхода может быть не эффектом лечения (полезным или вредным), а особенностью исхода у больных при наличии этого симптома.

 

  1. Методы контроля над систематическими ошибками
  1. На этапе дизайна исследования

Выбор популяции исследования первый и важнейший этап создания исследования. Этот выбор определяет прежде всего то, насколько актуален будет его результат. Выбор неверной популяции, редкой, с особенными свойствами, может привести к тому, что результат даже правильный, будет никому не нужен (не обладать внешней валидностью). Выбор популяции, в которой заболевание встречается редко, может привести к тому, что исследование, направленное на выяснение вреда загрязнения питьевой воды, вреда этого не обнаружит – удвоение частоты от 2/100 000 до 4/100 000 окажется статистически незначимым. Выбор источников информации в значительной степени определяет, что удастся найти. Например, если государственная статистика не регистрирует внезапную смерть новорожденных, то нелепо ориентироваться на нее в изучении этой и подобных патологий. Если статистика смертности от рака не предусматривает возможности исправления причин смерти задним числом, по мере установления окончательной причины смерти, то использование такой государственной статистики дает лишь ориентировочные представления об онкологической заболеваемости и смертности.[27] На этапе дизайна исследования, составления его протокола должны уточняться все детали выполнения работ на каждом из последующих этапов. Здесь лишь для удобства приемы повышения надежности исследования разнесены по этапам.

 

 

На этапе проведения исследования

Стандартизация методов сбора информации. Лишь на первый взгляд измерение выполняется просто. В действительности для получения не высококлассных, но даже обычных по точности и воспроизводимости результатов необходимо предпринимать значительные усилия для выработки правильного метода измерения и обеспечения правильного измерения всеми участниками исследования. Это относится не только к приборным измерениям, но и к измерениям, выполняемым с помощью опроса. Даже отлично разработанный и проверенный набор вопросов должен предъявляться опрашиваемым в стандартной обстановке, со стандартными вводными словами, поскольку отсутствие атмосферы приватности или выражение отношения к содержанию или форме вопросника способны изменить существенно отношение опрашиваемого к заданным вопросам. Невинная прибаутка, добавляемая интервьюером может улучшить отношение опрашиваемого к процессу, но радикально изменить его отношение ко всем или отдельным вопросам вопросника.

Поскольку обобщение результатов проведенных исследований (систематический обзор) представляет собою технологию дескриптивного исследования, в котором в качестве единиц анализа выступают не люди, а отдельные исследования, постольку систематический обзор весьма сильно подвержен всем смещениям, характерным для дескриптивных исследований. Основными приемами, которые позволяют минимизировать смещения в систематическом обзоре, являются получение максимально полного набора выполненных исследований. Поскольку никогда не известно, сколько исследований выполнено в действительности, единственное приемлемое решение – искать все исследования и получать данные из всех исследований. Как упоминалось выше, получить несмещенную выборку все равно невозможно, но минимизировать смещения – возможно.

Для того, чтобы избежать субъективности в оценках, выносимых по рентгенограммам, оценке текстов или собеседованиям (интервью), традиционно применяется прием повторной оценки одного и того же объекта разными людьми. Если это проводится без обеспечения независимости, то результаты таких повторных оценок будут искусственно согласованы. Например, если психиатр-консультант знаком с мнением коллег, уже исследовавших пациента, то мнение консультанта будет находиться под влиянием этого мнения и, в обычных обстоятельствах, согласовано с ним. Для обеспечения независимости всякая параллельная оценка должна проводиться без знания оценивающим результатов работы других специалистов. Например, независимая оценка рентгенограммы очень часто приводит к несогласию врачей, настолько часто, что врачи, никогда не принимавшие участия в такой работе, не могут этого себе представить – примерно в половине случаев.[28] Это справедливо для оценок ЭКГ и всех других измерений.[29,30] При изучении опубликованных статей обычно кажется ясным, что в них написано. Однако при выписывании из статей их результатов в таблицы для обобщения в систематическом обзоре оказывается, что два врача при чтении статей выписывают разные результаты! Существенные расхождения в извлечении содержания статьи возникают в каждом третьем случае. Лишь при целенаправленной тренировке – оценке статей и затем сравнении результатов – можно добиться того, что частота расхождений снижается примерно до 1/10.

Метод ослепления (маскирование). Для того, чтобы сравниваемые результаты измерения были по-настоящему независимыми, специалисты, проводящие измерение, должны работать, не зная результатов работы друг друга до момента завершения каждого случая. По его завершении результаты должны сравниваться, и в случае обнаружения расхождения это расхождение преодолеваться. Для этого существуют специальные процедуры. Простейшая состоит в ознакомлении с результатами параллельной оценки и обсуждении расхождения. Если расхождение связано с тем, что один из участников процесса упустил некую информацию, деталь, то легко возникает согласованное мнение. В некоторых случаях этого недостаточно и разрабатывается процедура с приглашением третьего специалиста, который, например, знакомится со всеми результатами и выносит свое решение, или, в свою очередь, принимает участие в голосовании. Иногда эти правила принятия согласованного мнения могут быть более сложными.

Метод ослепления – основной метод создания одинаковых групп для сравнения и обеспечения одинакового ведения пациентов. Всякий раз, когда о пациентах известно хоть что-нибудь, то отношение к ним становится соответствующим. Это вытекает из самой природы человеческих отношений. Мужчина и женщина, бедный и богатый, здоровый и больной не могут и не должны рассчитывать на то, что к ним будет совершенно одинаковое отношение. Эти особенности отношений не только создают «атмосферу», но и влияют на то, что делают медицинские и немедицинские специалисты. В изучении медицинских вмешательств идея о том, что сравнивать два вмешательства можно только в том случае, когда их применяли к одинаковым пациентам, уходит в прошлое по крайней мере на 200 лет. Беда заключалась в том, что в эти давние времена было неизвестно, что делать, если сравниваемые группы несравнимы. И сегодня врач, собрав данные о лечении пациентов одной болезнью разными методами, например, рентгеновским излучением и протонным, обнаруживает, что группа пациентов, которых облучали пучком протонов, отличается от тех, кого облучали рентгеновскими лучами меньшим размером опухоли.[31]

Можно ли по исходам лечения сделать вывод о том, какое облучение эффективнее? Конечно же – нет. Исключение составляют случаи, когда эффект в сравниваемых группах различается многократно (см. выше – влияние вмешивающихся факторов обычно не очень велико) или когда можно внести поправку на обнаруженное различие. К сожалению, в большинстве случаев внесение поправки, например, на тяжесть болезни или возраст, невозможно по причине малого числа пациентов. С другой стороны, внесение поправки на известный признак, по которому обнаружено различие, совсем не исключает наличия других, невидимых исследователю различий между группами. Например, можно внести поправку на длительность болезни до начала лечения, но одновременно группы могут различаться еще и по особенностям раковых клеток, неизвестному исследователю. Только рандомизация пациентов при включении их в проспективное исследование позволяет сделать сравниваемые группы сопоставимыми по всем, в том числе неизвестным признакам.

До той поры, пока исследователь не может создать для своего собственного исследования с одинаковые (в пределах случайных колебаний!) группы помощью рандомизации, и в тех случаях, когда проведение проспективного исследования невозможно, что нередко имеет место, например, у медицинских аспирантов, которые стеснены как во времени, так и в средствах, у исследователя остаются возможности наличными средствами сравнивать группы и изучать величину возможного смещения в результате неравенства групп.

 

На этапе анализа данных

Стандартизация – наиболее известный и достаточно эффективный способ внесения поправок на величину отдельного признака. Самый распространенный вид применения стандартизации – по возрасту. Можно, однако, стандартизовать, например, сравниваемые стационары по структуре коек и так далее[32]. Недостатком прямой и непрямой стандартизации является ограниченная возможность использования одновременно нескольких признаков. Например, если известно, что сравниваемые группы различаются одновременно по полу, возрасту и тяжести болезни, то весьма соблазнительно вычислительными средствами внести поправки на эти признаки и оценить, какова же разница в исходах при устранении влияния этих признаков. Этим целям служит ряд методов, основанных на регрессионном анализе.[33] Подчеркнём, что при внесении поправок на несколько признаков одновременно, в особенности при изучении небольших групп пациентов, легко возникают ситуации «перепоправки» и ложные результаты, не всегда очевидные. Кроме того, внесение поправок на известные различия между группами не исключает действия возможных неизвестных различий. Поэтому сравнение изучаемых групп по ряду доступных признаков – обязательная процедура для выявления возможных различий между группами, т.е. признаков СО отбора, но внесение  поправок на обнаруженные различия не исключает наличия других существенных различий.

Тем не менее, анализ серий случаев из практики имеет право на существование применительно к получению предварительных результатов, в особенности в тех областях, где проведение контролируемого эксперимента затруднено. Еще одним вариантом сравнения серий случаев или групп проспективного исследования, составленных без использования правильной рандомизации и ослепления является стратификационный анализ. Это – принципиально простая процедура, но очень полезная тем, что помогает исследователю лучше «увидеть и почувствовать» полученные данные. Она состоит в стратификации (разделении на страты – слои, группы) полученных данных. Например, в случае сравнения результатов лечения с использованием двух разновидностей оперативного вмешательства, длительное время сосуществующих в практике, такими стратами могут быть больны, оперированные в последние пять лет и по отдельности в предшествующие пятилетия. При таком сравнении может выясниться, например, что лучшие результаты у метода А обнаруживаются потому, что в течение 15 лет исходы при данном заболевании улучшаются (по каким-то причинам), и одновременно метод Б применяется реже; может быть видно, что для больных, оперированных в одно время, результаты двух методов лечения не различаются существенно.

Литература

References

1 A dictionary of epidemiology. 4 edn. IEA, Oxford University Press: Oxford, 2001:196.
2 Sackett DL, Oxman AD. HARLOT plc: an amalgamation of the world's two oldest professions. Brit Med J 2003;327(7429):1442-1445.
3 Kolstad HA, Olsen J. Why Do Short Term Workers Have High Mortality? Am J Epidemiol 1999;149(4):347-352. [http://aje.oxfordjournals.org/cgi/content/abstract/149/4/347]
4 Власов ВВ. Явления непреднамеренного отбора в клинических исследованиях. Клинич мед 1995;73(5):71-73.
5 Coughlin SS. Recall bias in epidemiologic studies. J Clin Epid 1990;43(1):87-91.
6 Hosek RS, Flanders WD, Sasco AJ. Bias in case-control studies of screening effectiveness. Am J Epidemiol 1996;143(2):193-201.
7 Grimes DA, Schulz KF. Bias and causal associations in observational research. L 2002;359:248-252.
8 Lachs MS, Nachamkin I, Edelstein PH et al. Spectrum bias in the evaluation of diagnostic tests: Lessons from the rapid dipstick test for urinary tract infection. Ann Intern Med 1992;117.- # 2:135-140.
9 Dickersin K, Min Y-I. Publication bias: The problem that won't go away. Ann N Y Acad Sci 1993;703:135-148.
10   Berlin JA, Begg CB, Louis TA. An assessment of publication bias using a sample of published clinical trials. J Amer Statist Assoc 1989;84:381-392.
11   Sterling TD. Publication decisions and their possible effects on inferences drawn from tests of significance - or vice versa. J Amer Statist Assoc 1959;54:30-34.
12   Cowley AJ, Skene A, Stainer K et al. The effect of lorcainide on arrhythmias and survival in patients with acute myocardial infarction: an example of publication bias. Int J Cardiol 1993;40(2):161-166.
13   Tramer MR, Reynolds DJM, Moore RA et al. Impact of covert duplicate publication on meta-analysis: A case study. Brit Med J 1997;315(7109).
14   Chapman S. Research from tobacco industry affiliated authors: need for particular vigilance. Tob Control 2005;14(4):217-219. [http://tc.bmjjournals.com]
15   Lopipero P, Bero LA. Tobacco interests or the public interest: 20 years of industry strategies to undermine airline smoking restrictions. Tob Control 2006;15(4):323-332.
16   Корнышева ЕА. Подлог. Междунар журн мед практики 2007;(2):9-14.
17   Власов ВВ. Дело Куржака. Междунар журн мед практики 2007;(2):15-16.
18   Cochrane Injuries Group Albumin Reviewers: Human albumin administration in critically ill patients: systematic review of randomised controlled trials. Brit Med J 1998;317:235-240.
19   Wilkes MM, Navickis RJ. Patient survival after human albumin administration. A meta-analysis of randomized, controlled trials. Ann Intern Med 2001;135(3):149-164.
20   Haley RW. Point: bias from the "healthy-warrior effect" and unequal follow-up in three government studies of health effects of the Gulf War. Am J Epidemiol 1998;148(4):315-323.
21   Pinsky PF, Miller A, Kramer BS et al. Evidence of a Healthy Volunteer Effect in the Prostate, Lung, Colorectal, and Ovarian Cancer Screening Trial. Am J Epidemiol 2007;165(8):874-881. [http://aje.oxfordjournals.org/cgi/content/abstract/165/8/874]
22   Lindsted KD, Frazer GE, Steinkohl M et al. Healthy volunteer effect in a cohort study: Temporal resolution in the Adventist Health Study. J Clin Epid 1996;49.- # 7:783-790.
23   Graham S, Graham-Thomas R. Achieved status as a risk factor in epidemiology. Am J Epidemiol 1985;122.- N. 4:553-558.
24   Weinberg CR. Toward a clearer definition of confounding. Am J Epidemiol 1993;137(1):-8.
25   Chan CK, Feinstein AR, Jekel JF et al. The value and hazard of standardization in clinical epidemiologic research. J Clin Epid 1988;41.- N. 11:1125-1134.
26   Horwitz RI, Feinstein AR. Exclusion bias and the false relationship of reserpine and breast cancer. Arch Int Med 1985;145(10):1873-1875.
27   Rahu M. Cancer epidemiology in the former Soviet Union. Epidemiology 1992;3(5):464-470.
28   Balabanova Y, Coker R, Fedorin I et al. Variability in interpretation of chest radiographs among Russian clinicians and implications for screening programmes: observational study. Brit Med J 2005;331(7513):379-382.
29   Власов ВВ. Эффективность диагностических исследований. 1 edn. Медицина: М., 1988:245;http://www.osdm.org/modules.php?name=Files&go=showcat&cid=8.
30   Власов ВВ. О совпадении врачебных оценок электрокардиограммы. Вpач 1996;(1):22.
31   Avakian MR, Marova EI, Kurpatovskaia LE et al. [Endocrine function in the late period after radiation therapy of acromegaly]. [Russian]. Zh Vopr Neirokhir Im N N Burdenko 1989;(5):32-34.
32   Власов ВВ. Эпидемиология. Гэотар-Мед: Москва, 2004:462.
33   Плавинский СЛ. Биостатистика: Планирование, обработка и представление результатов биомедицинских исследований при помощи системы SAS. Издательский дом СПбМАПО: СПб, 2005:559.


Статистическими критериями или критериями для проверки гипотез называют математические показатели, вычисляемые определенным образом на основе экспериментальных данных для того, чтобы установить, не являются ли полученные результаты, подтверждающие гипотезу исследователя или опровергающие ее, только лишь случайными

Совокупность результатов измерения, ранжированных по величине, называют «вариационный ряд»

 

1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"