Яндекс.Метрика В.В. Власов. Эпидемиология. Учебное пособие для вузов.  
Каждый слышит то, что понимает. Гете

Часть учебно-методических материалов сайта, в том числе электронная библиотека, доступны только заказчикам работ по анализу данных для кандидатских и докторских диссертаций, а также слушателям системы дистанционного обучения и консультаций. Запрос на выполнение анализа данных, обучение и консультации направляйте на мэйл E-Mail редактора БИОМЕТРИКИ

Логистическая регрессия в медицине и биологии

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

ВАК будет размещать диссертации в интернете до защиты
Тексты диссертаций будут размещать в интернете для обсуждения.
Об этом в субботу заявил председатель Высшей аттестационной комиссии (ВАК)
Владимир Филиппов в эфире радиостанции «Эхо Москвы».
По словам Филиппова, кандидатские диссертации будут вывешены на специальном форуме
как минимум за месяц, а докторские - за три месяца до защиты.

Почему и как надо учить медиков статистике?
Доклад на Международной конференции по доказательной медицине в Ереване (18 - 20.10.2012)

В.В. Власов.

Эпидемиология: Учебное пособие для вузов

Москва, Издательский дом "ГЭОТАР-МЕД",

2004. 464 с.

Никакое человеческое исследование
не может почитаться истинной наукой,
если оно не изложено математическими
способами выражения.

  ____________________
Леонардо да Винчи.
Книга о живописи, ч.1


Рецензия

Новая книга профессора В.В. Власова концептуально продолжает предыдущую его книгу "Введение в доказательную медицину". Поэтому, говоря о ней, невозможно отстраниться при этом от проблем доказательной медицины. Прежде чем перейти непосредственно к содержанию рецензируемого учебника, приведём несколько мнений о состоянии доказательной медицины в России. Для начала обратимся к статье самого Василия Викторовича Власова "Эпидемиология в современной России", опубликованной им 4 года назад в "Международном журнале медицинской практики" (2001 г., вып. 2. стр. 27). "... в России нет ни одной школы эпидемиологии в современном смысле слова, ни одной кафедры эпидемиологии и биостатистики, какие имеются на Западе в каждом университете, имеющем медицинский факультет. У нас на кафедрах эпидемиологии студентов учат эпидемиологии инфекционных болезней, а элементы статистики преподают на кафедрах физики (информатики) и социальной медицины. Значительная часть времени уделяется тому, что студенты медицинских факультетов на западе почти не изучают — микробиологическим аспектам гигиены питания, водоснабжения, рабочего места и места жительства. Изучение эпидемиологии неинфекционных заболеваний ограничено сведениями, предоставляемы им в процессе изучения неинфекционных заболеваний на клинических кафедрах. Такое положение биостатистики объяснимо".

Действительно, такой важный инструмент эпидемиологии как статистика, преподают в медицинских вузах на самых разных кафедрах. К примеру, в Саратовском государственном медицинском университете его преподают на кафедре экономики, управления здравоохранением и медицинского страхования. Вот как сообщается об этом на странице кафедры. "В настоящее время на кафедре ведётся преподавание более 20 дисциплин на всех факультетах СГМУ: правоведение и правовые основы деятельности врача, экономика здравоохранения, биостатистика и эпидемиология неинфекционных заболеваний, менеджмент в здравоохранении, медицинский маркетинг и др. ... . Кафедра занимается общим и тематическим усовершенствованием врачей по специальности „социальная медицина и организация здравоохранения“, является выпускающей для студентов отделения „Сестринское дело“ и базовой по организации и проведению подготовки интернов по специальности „Менеджер. Нетрудно догадаться об уровне преподавания биостатистики на кафедре, которая имеет спектр учебных дисциплин от права и экономики до математики.

Многое ли из того, о чём говорит автор статьи, изменилось в России за это время? Наивно было бы ожидать что за 4 года всё могло радикально измениться. Однако и думать, что всё осталось по-прежнему, тоже было бы заблуждением.  Во-первых, усилиями многих специалистов, и в том числе самого В.В. Власова, являющегося директором Российского Отделения Кокрейновского Сотрудничества и вице-президентом межрегионального общества специалистов доказательной медицины, научное сообщество начинает проникаться пониманием важности изменения описанной выше ситуации. Однако ошибочно было бы думать, что все заинтересованы в доказательной медицине, и что все те, кто говорит о её поддержке, сами реально следуют этому призыву. Более подробно мы рассмотрим это в отдельной статье, а сейчас вернёмся к содержанию рецензируемого учебника.

Сложность написания такого учебника заключается ещё и в том, что современная эпидемиология осваивает всё в большей степени статистические методы анализа. И по этой причине нельзя написать современный учебник эпидемиологии, не отдав должное статистике. О том, что статистические методы в эпидемиологии занимают в этом издании немалый объём, можно судить уже и по краткому оглавлению. Очевидно, что в такой ситуации крайне важно не впасть в одну из двух крайностей, нарушив гармонию соразмерности медицинских и статистических аспектов эпидемиологии. В противном случае легко вызвать либо недовольство медиков обилием статистических терминов и формул, либо напротив, вызвать недовольство специалистов по доказательной медицине слабостью изложения статистического аппарата эпидемиологии. Это противоречие носит принципиальный, и, на мой взгляд, неустранимый характер. Очевидно, что целью любого учебника, и этого в том числе, является донести до студентов определённые ЗНАНИЯ, но кроме этого дать и определённые НАВЫКИ реализации этих знаний, т.е. УМЕНИЯ, поскольку все квалификационные характеристики специалистов содержат разделы "Специалист должен знать" и "Специалист должен уметь".

В большинстве зарубежных развитых стран на было такого отлучения статистики от биомедицины, которое до сих пор наблюдается в России. Поэтому даже самый прекрасный учебник, по моему убеждению, не имеет никаких шансов на то, чтобы, обучаясь по нему, российский студент совместил в себе как эпидемиолога, так и биостатистика. Полагаю, что с этим утверждением согласится большинство читателей. Однако для того, чтобы эпидемиолога мог понимать биостатистик, первому необходимо дать необходимый запас статистических знаний, и даже простейших навыков в области статистики. По нашему мнению, главная цель подобного учебника заключается в том, чтобы дать читателю ЗНАНИЯ по эпидемиологии, и ПОДГОТОВИТЬ его к общению на вербальном и понятийном уровне с биостатистиком. Не случайно и сам В.В. Власов в процитированной нами статье говорит о кафедрах эпидемиологии и биостатистики, т.е. разделяя эти две научных специальности. Именно исходя из того, что эпидемиолог не должен быть биостатистиком, и наоборот, и надо оценивать, удалось ли автору благополучно пройти между "медицинской Сциллой" и "статистической Харибдой". Полагаю, что, прочитав данную книгу, у каждого читателя может быть свой ответ на этот вопрос. Мы же, руководствуясь пушкинским "Суди, дружок, не свыше сапога!", рассмотрим ниже лишь статистические аспекты этого издания. При этом всё написанное ниже отражает лишь нашу личную точку зрения. Мы понимаем, что каждый автор руководствуется при написании учебника своими взглядами, своим пониманием важности тех или иных аспектов излагаемого материала, своей аудиторией, для которой создаётся это творение и т.д.

Уже на стр. 17 в разделе "Эпидемиология интенсивно использует статистические методы" автор пишет: "Методы статистики были привнесены в медицину из сельскохозяйственного эксперимента и технического контроля качества". Действительно, эксперименты на "неживом объекте" гораздо легче реализовать, нежели на "живом объекте". И во многом по этой причине статистика, развившаяся на экспериментах в сельском хозяйстве и методах выборочного контроля качества в технике, стала основой для развития прикладной статистики. Бурному развитию статистики в середине 20-го века способствовал и тот факт, что ушедшие на фронты второй мировой войны квалифицированные кадры в военной промышленности заменили женщины и подростки, имеющие меньшую квалификацию. В итоге промышленность была вынуждена активно использовать статистические методы контроля качества военной продукции. Часть из этих методов была военной тайной вплоть до окончания второй мировой войны. Однако ещё за много лет до этого использование методов статистики активно пропагандировалось как в России (см. нашу статью "ИСТОРИЯ БИОМЕТРИКИ И ЕЕ ПРИМЕНЕНИЯ В РОССИИ"), так и в других странах. Об этом пишет и сам автор "Эпидемиологии" на стр. 293. "Идея необходимости выбирать вмешательство на основании экспериментальных данных имеет, по крайней мере, 200-летнюю историю. Более того, уже в 1840 г. парижанин Ж. Гаваре опубликовал книгу по медицинской статистике, в которой излагалась идея медицинского эксперимента, статистического анализа данных и доверительных интервалов. Ж. Гаваре предлагал врачам отдавать предпочтение одному из методов лечения при условии, если результаты лечения лучше и если разница результатов лечения превышает величину, зависящую от числа собранных случаев. К сожалению, практика надолго отстаёт от передовых идей ...". И сегодня можно наблюдать аналогичное отставание методологии медицинской науки от достижений современной прикладной статистики. Поэтому не исключено, что и многому из того, что будут изучать студенты по этому учебнику, уже уготована судьба идей Ж. Гаваре.  Такова уж судьба большинства хороших учебников...

Одной из отличительных особенностей данного учебника, как и предыдущих книг В.В. Власова, является стремление дать по возможности строгие определения не только относительно новым для медиков терминам, но и достаточно популярным и знакомым. Причём эти определения, априорно не могущие быть уникальными, единственными, приводятся в контексте других понятий, необходимых для погружения читателя в анализируемую автором проблематику. Фактически автор с самого начала начинает формировать необходимый глоссарий, который частично потом и приводит в конце учебника. Эта традиция восходит к лучшим российским педагогам, писавших прекрасные учебники в конце 19 - начале 20 века. Приведу небольшой пример. Раздел 1.2. "Методология научного исследования" содержит не только упоминания о Ф. Беконе, Э. Дженнере, К. Поппере, Т. Куне и основоположнике современной прикладной статистики Р. Фишере, но и обсуждение таких понятий, как ИЗМЕРЕНИЕ, ДАННЫЕ, ФАКТ, ИНФОРМАЦИЯ, ЗНАНИЕ, ГИПОТЕЗА, ЭКСПЕРИМЕНТ, ПРОПОРЦИЯ, ШАНС, СМЕРТНОСТЬ, МОДА, МЕДИАНА, РЕГРЕССИЯ и т.д. Очень важно, что автор даёт почувствовать читателю разницу между обыденным, бытовым смыслом некоторых из этих терминов, и теми смыслами, которые далее используются в последующих главах. Этот авторский приём неявно подготавливает читателя к осмыслению вероятностной модели языка, к вероятностному распределению смыслов, когда конкретный смысл термина во многом определяется содержанием контекста. Для большинства этих терминов автор приводит их написание на английском языке, а также условные обозначения, принятые в русскоязычных и англоязычных источниках. Усвоению и закреплению обсуждаемых статистических параметров помогает наличие в учебнике большого количества числовых примеров, сопровождаемых выражениями для вычисления отдельных выборочных параметров в среде пакета MS Excel. В других случаях эти примеры не требуют использования таких выражений и содержат все необходимые вычисления в специально сформированных таблицах, например при обсуждении методов анализа выживания, при анализе таблиц сопряжённости и т.д.

Вместе с тем следует отметить, что такие определения или утверждения иногда не в полной мере отвечают своему контексту. Чаще всего это наблюдается в тех случаях, когда автор касается статистических аспектов. Очевидно, что авторский тезаурус и его собственное семантическое поле в этих случаях доминируют, не позволяя достичь требуемой для учебника педантичности статистических формулировок. Полагаю, что такие случаи есть результат того, что рецензировали рукопись лишь медики. Приведу несколько таких примеров. На стр. 89 автор пишет: "В этом смысле суть статистического анализа заключается в соотнесении величины изучаемого компонента вариабельности с величиной прочих компонентов вариабельности. Если это отношение велико, то статистические критерии подтверждают гипотезу исследователя" (Выделено нами. В.Л.). Последнее утверждение было бы справедливым, если бы речь всегда шла только о так называемой альтернативной гипотезе H1, т.е. о гипотезе различия. Между тем исследователя в первую очередь может интересовать и гипотеза отсутствия различия, т.е. нулевая гипотеза H0, которая будет приниматься, когда обсуждаемое отношение напротив мало. Например, при проверке нормальности распределения количественного признака для исследователя приоритет имеет именно нулевая гипотеза H0, поскольку её принятие может означать корректность использования им параметрических критериев. И если нормальность распределения признака принимается, то можно использовать, к примеру, критерий Стьюдента. Однако и в этом случае исследователь должен проверить ещё одну гипотезу - равенства генеральных дисперсий. Как видим и здесь больший интерес для исследователя представляет именно нулевая гипотеза H0. Рассмотренный нюанс авторского определения достаточно показателен, поскольку подавляющее большинство специалистов в биомедицине ориентированы в своей исследовательской практике именно на поиск различий (сравнение лекарств "лучше-хуже", "больной-здоровый", "выжил-умер" и т.д.). И если проанализировать отечественные журнальные публикации, монографии и диссертации, то мы почти не найдём в них обсуждения результатов, которые воспринимались бы как положительные, когда подтверждается нулевая гипотеза об отсутствии различий.

Второй пример заимствуем из раздела 1.8. "Статистический анализ данных". На стр. 131 автор пишет: "Доказать правильность гипотезы проведением подтверждающего её эксперимента нельзя, зато можно высказать противоположную гипотезу и отвергнуть её опытом (см. разд. 1.2). Поэтому сначала предполагается, что группы неразличимы (нулевая гипотеза). Затем доказывается, что эта гипотеза может быть отклонена" (Выделено нами. В.Л.). Поскольку в данном контексте речь идёт о статистической нулевой гипотезе, то сказать лишь о том, что "группы неразличимы", явно недостаточно. У читателя, начинающего изучение эпидемиологии по этому учебнику, вполне логично возникает вопрос: а в чём именно эти группы "неразличимы"? Ведь не исключено, что в чём-то сравниваемые группы могут быть неразличимы, а в другом - различимы? Неполнота данной формулировки в отсутствии её взаимосвязи с терминами и понятиями, обсуждавшимися ранее в разделе 1.6. "Оценка распределения величин", в частности, с параметрами этих распределений. Классические определения статистических гипотез, как нулевых, так и альтернативных, обязательно содержат упоминание о генеральных (популяционных) параметрах этих распределений. Приведём одно из определений статистической гипотезы, которое даётся в известной книге А. Афифи и С. Эйзена "Статистический анализ: Подход с использованием ЭВМ", М.: Мир, 1982, приведённое на стр. 433: "Статистическая гипотеза - это утверждение относительно значений одного или более параметров данного распределения или о самой форме распределения. Следовательно, статистическая гипотеза является утверждением относительно генеральной совокупности, описываемой этим распределением". Аналогичные определения в других изданиях также содержат упоминания о распределениях и генеральных параметрах этих распределений.

Вряд ли корректным можно признать и использование автором слова "доказывается" в приведённой выше цитате. Статистические выводы всегда имеют вероятностную природу, и лишь для сугубо детерминированных выражений (алгебраические уравнения, геометрические теоремы и т.п.) уместно использование выражения "доказывается". В логике это явление называют "подмена понятия", и природа такой "глобализации" достаточно подробно рассмотрена Н.А. Зориным в его работе " О неправильном употреблении термина "достоверность" в российских научных психиатрических и общемедицинских статьях ".

Впрочем, не исключено, что автор в подобных утверждениях специально переходит на тот уровень изложения, к которому более привычны читатели этого учебника. Так на стр. 78 объясняя технологию построения доверительных интервалов, автор сразу же упоминает о параметрах: "Вычисление ДИ называют также интервальной оценкой параметра". А уже в следующем абзаце, опуская термин "параметр" говорит о построении доверительных интервалов для качественных и количественных признаков.

Один из основных разделов учебника посвящён теме "Оценка распределения величин". Наиболее подробно рассмотрены оценки центральной тенденции, которые в учебниках по математической статистике принято называть мерами положения (раздел 1.6.1.). Объяснение этих понятий удачно иллюстрируется графиками и гистограммами, а также сопровождается выражениями для пакета Excel, позволяющими оценить значения данных параметров. Здесь же очень кстати автор приводит и графики с разными видами асимметрии.

На фоне достаточно подробного и полного рассмотрения мер центральной тенденции, по нашему мнению, автор незаслуженно мало осветил оценки вариабельности (раздел 1.6.2.). Разумеется, интерквартильный размах, определяемый как интервал между 75-й и 25-й процентилью, важный показатель вариабельности. Однако это не единственный подобный показатель. Вполне уместно было бы именно в этом разделе рассмотреть и такие оценки вариабельности, как размах, дисперсия, стандартное отклонение, и, наконец, коэффициент вариации, который рассмотрен в следующем разделе 1.6.3. "Нормальное распределение". У читателей может сложиться искусственное представление, что эти оценки вариабельности присущи лишь нормальному распределению. Более уместно было бы перенести и обсуждение положительной взаимосвязи между средним и вариабельностью из раздела "Нормальное распределение" в раздел "Оценка вариабельности". Весьма важным моментом, о котором следовало бы более подробно говорить при обсуждении оценок вариабельности, является увеличение вариабельности в группах больных (по сравнению со здоровыми). Для примера приведём следующие графики, построенные при анализе реальных данных.

Гистограммы распределения в группе здоровых
Гистограммы распределения в группе больных ИБС






В подобных случаях рост вариабельности вовсе не обязательно сопровождается описанным в учебнике ростом среднего значения.

Выше мы уже говорили о том, что крайне трудно, если вообще для подобного учебника, возможно, провести некую грань, которая бы позволяла автору принимать решение о том, что дальнейшее углубление в статистические нюансы обсуждаемого материала для данной категории читателей излишне. И потому в таких случаях видимо целесообразно лишь ограничиться упоминанием о самом существовании этого нюанса, дав при этом ссылки на источники, не вдаваясь в более подробное его описание. Именно такая ситуация, по нашему мнению, возникает в разделе 1.6.4., когда автор рассматривает F-критерий, обсуждая его как статистический критерий для проверки гипотезы о равенстве двух генеральных дисперсий. Очень уместно при этом авторское упоминание о том, что равенство дисперсий является обязательным условием использования t-критерия Стьюдента. Нюанс же, который остался неотмеченным, заключается в том, что прежде чем использовать F-критерий Фишера, необходимо проверить так называемую основную гипотезу о нормальности распределения в обеих сравниваемых совокупностях. Обсуждая устойчивость различных статистических критериев к отклонениям от нормальности, М.Кендалл и А. Стьюарт в своей известной монографии "Статистические выводы и связи" (М.:Наука, 1973, 899 с.) пишут: "... критерии, касающиеся дисперсий (т.е. Хи-квадрат для дисперсии нормального распределения, F-критерий для отношения дисперсий двух нормальных распределений и модифицированный критерий отношения правдоподобия для равенства нескольких дисперсий ...) очень чувствительны к таким отклонениям". Более того, результаты, приведённые в книге Г. Шеффе "Дисперсионный анализ" (М.: Наука, 1980, 512 с.) говорят о том, что в этом случае очень сильно влияют и такие параметры, как асимметрия, эксцесс и соотношение объёмов сравниваемых выборок.

Другой нюанс, непосредственно касающийся этого раздела, заключается в том, что в реальных задачах кроме сравнения двух генеральных дисперсий приходится сравнивать и большее их количество - 3, 4 и т.д. И для проверки подобных гипотез существуют другие критерии, в частности критерии Кокрена (Кочрена, Кохрэна), Бартлетта, Хартли, Ливена и др., которые также очень чувствительны к отклонениям от нормальности. Возникает дилемма: нужно ли упоминать в учебнике для эпидемиологов об этих статистических нюансах, если не приводится достаточно подробно изложенных процедур проверки нормальности распределения? Полагаю, что это следует делать как минимум по трём причинам. Во-первых, для того, чтобы будущий читатель, воодушевлённый кажущейся простотой проверки таких гипотез, не пришёл в будущем к ложным заключениям в реальных исследованиях. Во-вторых, для того, чтобы будущий эпидемиолог понимал, что биостатистика - это достаточно сложная наука, и уже потому для получения честных результатов, которым можно доверять, а не тех, которые используются в качестве "статистического бантика" для украшения статьи или диссертации, следует обращаться к профессионалу. И, в-третьих, чтобы стимулировать дальнейшее образование будущего эпидемиолога.

Надо отметить как положительный момент то, что в учебнике рассмотрено несколько наиболее известных вероятностных распределений: нормальное, логнормальное, биномиальное и Пуассона. Однако, учитывая то, что в дальнейшем используются статистические критерии, имеющие и иные распределения, имело бы смысл рассмотреть и их. В частности, распределения Хи-квадрат, Стьюдента и F-распределение. Тем более что все эти распределения функционально взаимосвязаны друг с другом и с нормальным распределением. Отметим, что рассмотрение перечисленные выше распределений автор сопровождает графическим и числовым материалом, полученным на основе реальных данных. Можно сказать, что учебник буквально насыщен реальными примерами. Это значительно облегчает восприятие и понимание излагаемого материала. Тот факт, что более 60 таких примеров заимствованы из зарубежных источников, и лишь один из русскоязычного медицинского журнала, красноречиво свидетельствует об уровне развития отечественной эпидемиологии. Однако такое доминирование зарубежных примеров для отечественных исследователей имеет и отрицательное воздействие, поскольку будет вызывать у них сомнения в способности добиться подобных результатов в нынешних реалиях. Ничто не будет так провоцировать читателей на стремление к хорошим образцам, к дублированию этих образцов, как демонстрация наличия таких образцов и в России, а не только в иных странах. Регулярно делая поиск в интернете по ключевым словам "биостатистика" и "эпидемиология" я вижу, что число хороших работ, в которых эпидемиологические задачи успешно решаются методами биостатистики, неуклонно растёт. И хотя их число не столь многочисленно как хотелось бы, но они есть. Будем надеяться, что второе издание этого учебника пополнится такими примерами из отечественных исследований.

Внимательное чтение этого учебника с самых первых страниц приводит к пониманию того, что автор увлечён этой тематикой. Более того, многие авторские приёмы говорят о том, что они созданы не просто специалистом и исследователем, имеющим большой опыт, но ещё и педагогом. Полагаю что те, кто сам имеет прямое отношение к преподавательской деятельности, согласятся со мной после прочтения этого учебника. Приведу небольшой пример. На стр. 130 читаем: "Гипотеза, которая подвергается исследованию. должна быть ясно сформулирована до начал исследования и записана" (Выделено нами. В.Л.). Именно последнее слово в этой фразе особенно важно! Действительно, процесс вербального формулирования гипотезы и последующей её записи существенно отличаются друг от друга. Именно процедура ЗАПИСИ неизбежно приводит к тому, что формулировки становятся компактнее, яснее, непротиворечивее и более доступными для остальных участников исследования. Автор этих строк сам придерживается такой же технологии в собственной работе. Особенно важен этот методологический приём для начинающих исследователей, нынешних и недавних студентов. Будучи вузовским преподавателем, я сам воочию вижу сколь бедна речевая практика у студентов применительно к учебным дисциплинам. И тем более трудно им формулировать и записывать более сложные тексты, описывающие программы исследований. Тому есть много причин, в частности, смещение от чтения в сторону ТВ и т.д. В этом же абзаце автор далее пишет: "История науки знает немало примеров того, как исследователи изменяли гипотезу по ходу исследования, в согласии с теми данными, которые они получали. Результат такого исследования неизменно положителен: гипотеза изменяется в соответствии с данными, и данные, естественно подтверждают гипотезу. Но результаты исследования с таким тяжким дефектом никому не нужны". (Выделено нами. В.Л.). Позволю в данном случае не согласиться с уважаемым Василием Викторовичем: нужны! Но очень немногим, в первую очередь самому исследователю, и, возможно, руководителям таких горе-исследователей.

В качестве примера приведу не столь давний случай. Осенью 2004 г. ко мне на статистическую рецензию из "Сибирского медицинского журнала" поступила рукопись, написанная авторами из города К., расположенного в европейской части России. В рукописи рассматривались факторы антимикробной активности минеральной воды. В рецензии на рукопись авторам было указано на некорректность использования ими t-критерия Стьюдента, а также на то, что результаты перепроверки полученных ими выводов с помощью построения доверительных интервалов для средних в опытной и контрольной группах (каждая численностью по 7 наблюдений), дали противоположный результат. В связи с этим авторам предлагалось представить для реанализа первичные данные. Спустя несколько месяцев авторы прислали новую версию рукописи, в которой все прошлые ошибки были вновь воспроизведены. Для иллюстрации приведу лишь небольшой фрагмент этой рукописи. "Для выяснения возможности применения коэффициента Стьюдента сопоставляли значения средней арифметической, медианы и моды, а также использовали способ нормирования" (Выделено нами. В.Л.). О том, как "сопоставляли" - средние со средними, медианы с медианами, а моды с модами, или же все три величины друг с другом, а также что и как "нормировали", авторы скромно умолчали, видимо полагая, что читателю не обязательно знать подобные детали.  Более того, когда был выполнен реанализ присланных первичных данных, то оказалось, что в одной из таблиц, в которой были приведены самые важные результаты, послужившие основой главных выводов рукописи, среднее из 7 чисел значительно отличается от того среднего, которое записано в рукописи для этих же самых чисел. Но при этом (NB!) ошибки среднего совпали полностью! В результате реанализа первичных данных были получены выводы, противоположные авторским. Итак, если ошибки средних совпадают, но средние отличаются, а также то, что в рукописи авторы упоминают об использовании ими для статистического анализа компьютерной программы, то о чём это говорит?

С точки зрения потребителя некачественной информации не имеет значения, является ли такая дезинформация продуктом специальной фальсификации, или же результатом искреннего заблуждения или непрофессионализма. Поэтому будущий эпидемиолог должен владеть первичными навыками "техники статистической безопасности", которые бы позволяли ему достаточно быстро обнаруживать выводы, базирующиеся на сомнительных статистических манипуляциях. Либо в более сложных ситуациях уметь сформулировать свои сомнения биостатистику. Полагаю, что данный учебник содержит очень много информации, усвоив которую эпидемиолог может либо самостоятельно, либо с помощью биостатистика разрешить свои сомнения относительно тех или иных публикуемых результатах.

Будущий читатель неоднократно встретит в учебнике упоминание о статистических пакетах, с помощью которых могут быть реализованы обсуждаемые методы. Разумеется, такая информация очень полезна, особенно если речь идёт не только о 2-3-х наиболее популярных пакетах, но и о менее известных. Так, подробно обсуждая понятие статистической чувствительности, В.В. Власов говорит о программах StatCalc и EpiInfo, с помощью которой можно вычислять требуемые для исследования величины. Последнюю версию 3.3 программы EpiInfo, содержащую подпрограмму StatCalc, читатели могут скачать с нашего сайта. Аналогичные адреса автор приводит и для ряда других используемых в учебнике материалов, например для "Федерального руководства для врачей по использованию лекарственных средств (формулярная система)", "Руководства по профилактической медицине" и т.д. Вместе с тем, анализ результатов поиска в интернете по эпидемиологической тематике, говорит о том, что на сегодня этот перечень может быть многократно расширен. Поэтому читатель не должен забывать об этом и не полагаться лишь на ссылки, приведённые в этом учебнике.

Один из важных этапов статистического анализа эпидемиологических данных состоит в выборе вида критерия. В разделе 1.8.4. автор достаточно подробно останавливается на этом вопросе. Процитируем отдельные фрагменты этого раздела. "Важным аспектом статистической проверки гипотез является выбор одно- или двухстороннего статистического критерия (one - or two-tailed test, англ.). ... Выбор критерия диктуется характером данных, полученных в ходе исследования, структурой исследования и вопросом, поставленным для исследования. В выборе критерия можно руководствоваться приложениями 3 и 5". Думаю, что в этих утверждениях автор допускает смешение нескольких понятий. Поясним подробнее нашу мысль. Если обратиться к упомянутым приложениям 3 и 5 на стр. 443-445, то мы увидим в них перечисление как непосредственно статистических критериев, например критерия Пирсона Хи-квадрат, t-критерия Стьюдента, рангового критерия Вилкоксона и т.д., так и перечисление статистических методов: дисперсионного анализа, лог-линейной модели, логистической регрессии и т.д. В то же время в начале приведённой цитаты речь идёт о "выборе одно- или двухстороннего статистического критерия". Более адекватно в данном контексте было бы говорить о выборе альтернативной статистической гипотезы, которые бывают одно- и двухсторонние, поскольку статистические гипотезы первичны, по отношению к статистическим критериям. В этом случае для одного и того же критерия критическая область будет различной. Более того, один и тот же критерий проверки гипотез может аппроксимироваться различными статистиками. Что, в свою очередь, может приводить к несколько отличающимся значениям достигнутого уровня значимости. Поэтому в данной ситуации последовательность выбора должна в первую очередь диктоваться вопросом, поставленным для исследования, о чём и пишет В.В. Власов. Затем уже на его основе формулируются нулевая и альтернативная гипотеза (одно- или двухсторонняя), и далее для проверки этих гипотез выбирается статистический метод и тест (критерий), имеющий изученное распределение вероятностей. Как правило, в подавляющем большинстве статистических пакетов пользователю не нужно производить выбор статистики для теста, поскольку в результатах анализа выдаются все статистики вместе с достигнутыми уровнями значимости.

ROC-кривые 5 диагностических признаков для кардиобольных.

 

В последние годы всё большую популярность приобретает так называемый ROC-анализ (Receiver Operating Characteristic, ROC-curve). В разделе 2.2.6. автор достаточно подробно обсуждает этот вид анализа. В интернете можно найти немало примеров использования этого вида анализа как зарубежными, так и отечественными исследователями. Слева представлен график, на котором изображены реальные ROC-кривые, полученные при анализе 5 диагностических признаков на массиве кардиологических больных. Как видим, наилучшее качество (большая площадь под кривой) наблюдается для признака Can1 - первая каноническая ось, полученная с помощью дискриминантного анализа. Более того, для непрерывных количественных показателей возможно получение оценки такого значения этого показателя, который обеспечивает максимально возможное качество диагностики.

 

Сравнение 2-х ROC-кривых.

 

 

 

Однако все эти кривые построены на основании выборок различного объёма, и потому имеет смысл провести проверки статистических гипотез о попарной однородности, идентичности этих кривых. Сравнение тестов для признаков VAR113 и VAR116 показывает наличие статистических значимых различий между этими диагностическим признаками. Теория метода сравнения изложена в статье "Hanley JA, McNeil BJ (1983) A method of comparing the areas under receiver operating characteristic curves derived from the same cases. Radiology, 148, 839-843".

Раздел 2.4.2. "Применение критерия хи-квадрат и точного критерия Фишера" даёт читателю достаточное представление об анализе таблиц сопряжённости, который применяется уже более 100 лет. Нетрудно догадаться, что за эти годы теория данного вида анализа достигла большого развития. В частности, в случае отвержения нулевой гипотезы об отсутствии независимости двух признаков, возможно проведение гораздо более детального анализа о структуре обнаруженной взаимосвязи. Наши читатели могут познакомиться с кратким изложением данного метода и ссылками на соответствующую литературу, а также воспользоваться готовыми программами анализа таблиц сопряженности и программой вычисления точного критерия Фишера размещёнными на нашем сайте. Немало примеров анализа таблиц сопряжённости дано в книге Д. Абрамсон, З. Абрамсон "ОСМЫСЛЕНИЕ ЭПИДЕМИОЛОГИЧЕСКИХ ДАННЫХ. Руководство-самоучитель по интерпретации эпидемиологических данных", которую читатели могут скачать с нашего сайта.

Доступное изложение наиболее популярных непараметрических критериев (раздел 2.4.5.) делает возможным для неподготовленных читателей их использование даже без применения компьютера. Приведённые в нескольких таблицах этого раздела примеры наглядно демонстрируют такую возможность. Отметим, что в разделе 2.4.6. "Временные ряды и прогнозирование" в подписи к рис. 2-27 упоминается квадратичная (Б) аппроксимация изменения числа инфицированных ВИЧ, однако на самом рисунке представлена лишь линейная (А) аппроксимация. С примерами подобной нелинейной аппроксимации читатели могут познакомиться в наших статьях "Выродимся или вымрем, что наступит раньше? В Томске и Северске после 1993 г. всё чаще рождаются дети с врождёнными пороками развития" и "Уровень врождённых пороков развития в томской популяции и действие гелиогеофизического фактора".

Очень наглядно и убедительно автор излагает основы изучения различия заболеваемости в пространстве и основы географического анализа (раздел 2.5.), в котором рассматриваются территориальные аспекты эпидемиологических показателей. Достоинства этого анализа наглядно иллюстрируются примерами из реальных исследований и графиками. В дополнение к тому, что изложено в учебнике, хотелось бы также отметить результативность другой разновидности этого анализа. С типичным примером этой разновидности - совмещению зонированных карт по заболеваемости и аналогичных карт по распределению факторов риска, читатели могут познакомиться на примере анализа экологической карты г. Владивостока. Поводом к проведению данных работ послужило изменение экологического состояния территории г. Владивостока в результате пожара и взрыва арсенала Тихоокеанского флота 15 мая 1992 г. с последующим ростом заболеваемости детей.

Довольно большой объём, автор учебника отводит t-критерию Стьюдента. Объясняется это, по-видимому, тем, что данный критерий достаточно популярен среди отечественных исследователей. Полагаю, что эта популярность, в противоположность зарубежным коллегам, обусловлена не столько их надеждой на устойчивость критерия к отклонениям от условий обоснованного применения, сколько незнанием других методов анализа.. К такому выводу приводят наши результаты анализа около 2 тысяч отечественных и зарубежных журнальных статей, согласно которым t-критерий Стьюдента используется в русскоязычных публикациях в 58% случаев, тогда как в англоязычных публикациях лишь в 11% случаев.

Если рассмотреть ограничения на использование данного критерия, приведённые в разделе 2.5.2., то можно добавить некоторые уточнения. В частности, из первого условия следует возможность, хотя и ограниченная, использования дискретной шкалы. Это противоречит третьему условию, где говорится о необходимости нормальности распределения, которое является непрерывным. Условия 2 и 3 также следует уточнить. В частности, говоря о том, что "В выборках дисперсии равны", автор неявно подразумевает, что речь идет о равенстве дисперсий не выборочных, которые вычисляются по выборкам, а о равенстве генеральных (популяционных) дисперсий, которые нам неизвестны. Аналогичное замечание относится и к третьему условию "В обеих выборках нормальное распределение". Т.е. речь идёт в данном случае о необходимости проверки двух статистических гипотез, что требует оперирования генеральными (популяционными) параметрами. Снижение уровня используемого словаря в учебнике, ориентированном на читателей с заведомо более низкой подготовкой в данной области, нежели сам автор, может привести их при чтении к нежелательным коллизиям. Четвёртое условие "Выборки достаточно велики" достаточно спорно, поскольку сама теория t-критерия, разработанная английским химиком и математиком В.Госсетом, более известным под псевдонимом Стьюдент (Student), называлась теорией малых выборок.

Очень важно, что автор, разбирая дисперсионный анализ, говорит об имеющихся ограничениях для данного метода и его устойчивости к отклонениям от нормальности. Но особенно важно упоминание автором требования равенства генеральных дисперсий. В 50-60-е годы прошлого века была опубликована целая серия работ по проверке устойчивости метода к отклонениями от этого условия. Оказалось, что при равных объёмах выборок это отклонение не столь сильно влияет на результат. Тогда как для случаев с неравными объёмами сравниваемых групп ошибка первого рода уменьшается или увеличивается в зависимости от того, в выборке какого объёма (меньшего или большего) наблюдается большая (меньшая) дисперсия. В совокупности с возможными отклонениями от нормальности, ошибка первого рода может, как уменьшаться, так и увеличивается в несколько раз. Поэтому при подобных отклонениях целесообразно использовать выборки равных объёмов и перепроверять результат с помощью непараметрических критериев.

Достаточно основательно автором описаны методы изучения смертности (раздел 2.6.) и когортные исследования (раздел 2.7.). Это радует, поскольку данные методы описаны в отечественной литературе крайне скудно, хотя потребность в них достаточно велика. И хотя эти краткие описания, конечно же, не заменят руководства пользователя для конкретного статистического пакета, ясное о понятное описание идейной стороны этих методов очень важно.

Рассматривая понятие корреляции, автор приводит очень уместный пример, отражающий тот факт, что имеющаяся связь между двумя количественными признаками может наблюдаться вследствие того, что оба этих признака имеют связи с третьим признаком. Уже этот пример демонстрирует опасность трактовки обнаруженных корреляционных связей как прямых причинно-следственных связей. В сложных системах существуют целые сети подобных взаимосвязей, и в таких случаях нередко вообще затруднительно определить направление причинно-следственной связи (не путать с направлением корреляционной связи, положительной или отрицательной). Поэтому от исследователя требуется огромный запас знаний в области всего комплекса медико-биологических дисциплин, опыта, а подчас и интуиции, чтобы на основе статистически значимых корреляционных связей восстановить цепочки причинно-следственных связей. Говоря о коэффициенте корреляции Пирсона, автор напоминает о том, что этот коэффициент используется для признаков имеющих нормальное распределение, лишь переходя к ранговой корреляции Спирмена, тогда как разумнее это было сделать в самом начале. Не вполне понятно авторское требование об отсутствии различия дисперсий у двух изучаемых признаков, поскольку эти признаки могут иметь различные единицы измерения и масштаб.

Как положительный момент данного учебника можно отметить тот факт, что в нём кроме множественной регрессии изложена также идейная сторона логистической регрессии. Несмотря на достаточную трудоёмкость данного метода, он завоёвывает всё большую популярность среди эпидемиологов. На этом же уровне изложены дискриминантный и ковариационный анализ. Примеры использования логистической регрессии, кластерного анализа и дискриминантного анализа читатели могут найти в наших статьях "ВОЗМОЖНОСТИ БИОМЕТРИЧЕСКОГО АНАЛИЗА ВЗАИМОСВЯЗИ СОМАТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И СИСТЕМАТИКИ ПСИХИЧЕСКИХ  РАССТРОЙСТВ" (Сибирский медицинский журнал, № 2, 2001, с. 25-32), "АРТЕРИАЛЬНАЯ ГИПЕРТОНИЯ КАК ПСИХОСОМАТИЧЕСКАЯ ПРОБЛЕМА" (КЛИНИЧЕСКАЯ МЕДИЦИНА, № 1, 2004, С. 35-41) и "ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ В АНАЛИЗЕ СВЯЗИ АРТЕРИАЛЬНОЙ ГИПЕРТОНИИ И ПСИХИЧЕСКИХ РАССТРОЙСТВ" (Сибирский медицинский журнал, № 3-4, 2001, с. 42-48).

Думаю, что достаточно подготовленный в области биостатистики читатель может упрекнуть автора в том, что в учебнике отсутствуют многие интересные методы, такие как кластерный и факторный анализ, мультипликативная регрессия и регрессия Бокса-Кокса, метод канонических корреляций и т.д. Однако не будем забывать, что это учебник ЭПИДЕМИОЛОГИИ, а не учебник БИОСТАТИСТИКИ. Важно то, что внимательный читатель, познакомившись с этим учебником, найдёт здесь много важной и полезной информации именно по эпидемиологии, которая не сводится к одному, пусть даже и важному инструментарию - биостатистике. В.В. Власов в своём учебнике убедительно демонстрирует необходимость и полезность взаимодействия эпидемиологии с политикой, экономикой, квалиметрией (наука об измерении качества), географией, правом и т.д. Поскольку главным объектом эпидемиологии является человек, то такие междисциплинарные взаимодействия объективны и неизбежны.

И хотя некоторым читателям может показаться, что автор этих строк отступает от своего тезиса "Суди, дружок, не свыше сапога!", позволю подробнее остановиться на главе 6 "Этические проблемы эпидемиологии". Во-первых, потому что содержание этой главы частично всё же касается биостатистики. Во-вторых, потому что тот факт, что именно этой главой автор заканчивает свой учебник, с нашей точки зрения, весьма симптоматично. Проблема медицинской этики для В.В. Власова не нова. Фактически его книга "Медицина в условиях дефицита ресурсов" (М.: Триумф, 1999, 189 с.) и посвящена оптимальному, и в то же время этическому, подходу к решению этой проблемы. Не случайно, что, обсуждая эту проблему, один из последних разделов этой книги он назвал "Власть и справедливость в сфере медицины". Говоря об этических проблемах эпидемиологии, В.В. Власов выделяет два аспекта: обязательства перед участниками исследования и обязательства перед обществом. Приведём несколько цитат из этой главы.

"По завершении исследования его исходные материалы должны быть сохранены для возможного повторного анализа, по крайней мере, в течение 5 лет после обнародования его результатов. В медицине, где исследования проводятся с участием пациентов, бескорыстное предоставление последними своего тела, своего времени исследователю делает полученные сведения общественным достоянием. Во многих странах закон обязывает сохранять сведения, полученные в ходе исследований, выполненных на средства бюджета, и обеспечивать к этим материалам доступ другим исследователям. В результате такой практики материалы многих исследований повторно используются для проверки новых гипотез и позволяют получить новые знания без проведения новых дорогостоящих исследований. Ведущие международные журналы требуют от авторов поступивших статей подтверждения, что и сходные материалы исследования сохранены и могут быть предъявлены для контрольного анализа. Результаты эпидемиологических исследований подвергаются повторному анализу значительно чаще, чем результаты клинических исследований. Чем более важные результаты получены и болезненнее проблема, тем выше вероятность проведения нового анализа".

Проводя в течение нескольких лет статистическое рецензирование рукописей, поступающих в "Сибирский медицинский журнал", я не раз сталкивался с тем, что результаты реанализа затребованных у авторов исходных данных были противоположны тем, что авторы приводили в своих рукописях. Этот факт естественно не означает, что буквально во всех подобных случаях имелся факт фальсификации результатов. Полагаю, что в большинстве случаев это был результат некорректно выполненного авторами статистического анализа. В этой связи уместно напомнить известное выражение Томаса Гексли: "Математика подобна мясорубке, она может переработать любое мясо, но для того, чтобы получить хорошие котлеты, нужно и хорошее мясо", добавив к этому, что и "мясорубка" тоже должна быть адекватна "перерабатываемому сырью".

За рубежом в последние годы опубликовано немало материалов об этической стороне научных исследований, и в частности, медицинских исследований. Этому способствовало раскрытие многих случаев фальсификации результатов научных исследований. Начинает формироваться юридическая база, регламентирующая как само понятие научного преступления, так и меры ответственности допускающих такие преступления. Более подробно мы рассмотрим это в отдельной статье, которую опубликуем в скором времени. О проблеме сохранения исходных данных мы писали неоднократно в наших статьях, в частности в статье "Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях". В России этот вопрос вообще никак не регламентирован. Более того, в известных нам биомедицинских журналах, за исключением "Сибирского медицинского журнала", в редакционных требованиях вообще не упоминается необходимость предоставления авторами исходных данных, в случае возникновения сомнений в истинности выводов. Остаётся лишь сожалеть, что В.В. Власов не привёл конкретных ссылок на материалы, иллюстрирующие приведённую выше цитату. Полагаю, то знакомство с подобными материалами было бы полезно для всех читателей этой книги. Вообще в качестве одного из недостатков этого издания следует назвать довольно скромный список литературы. Для сравнения, в упоминавшейся выше книге "Медицина в условиях дефицита ресурсов" автор привёл 145 источников на 189страниц текста, против 24 источников на 462 страниц рецензируемого учебника.

Учебник заканчивается достаточно подробным словарём основных эпидемиологических терминов, ответами на контрольные вопросы и задачи, Приложением, содержащим разнообразные статистические таблицы, и двуязычным предметным указателем. Всё это, как и масса реальных примеров со ссылками на первоисточники, задач, графиков, определений, схем и формул, несомненно, делает данный учебник действительно учебным пособием не только по его официальному статусу, но и по содержанию. Полагаю, что вузовские преподаватели по достоинству оценят этот учебник, который помогает реализовать известный афоризм академика Л. Арцимовича "Студент - это не сосуд, который надо заполнить знаниями, а факел, который нужно зажечь".  Уверен, что учебник найдёт своего благодарного читателя, а мы будем ждать от автора следующего его издания, как пишут в таких случаях, "исправленного и дополненного".

Наши читатели могут заказать учебник в издательстве "ГЭОТАР-МЕД" по тел. (095)245-86-21 и по факсу (095)743-70-87, а также по электронной почте E-mail: sales@geotar.ru

Цена книги по состоянию на февраль 2005 г. 185 руб. (без почтовых расходов).


 

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

Отзывы заказчиков по статистическому анализу данных

Дистантное обучение биостатистике с помощью IP-телефонии. Информация о специализированных курсах и семинарах по прикладной биостатистике для студентов, аспирантов, докторантов и научных сотрудников НИИ и вузов работающих в области биологии, медицины, социологии, психологии и т.д. (См. далее)

Отзывы по дистантному обучению статистике  

23.02.2005. © Василий Леонов


1997 - 2017.© Василий Леонов

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"