Меметический анализ описаний методов статистики

Меметический анализ описаний методов статистики

Приведенные выше клише, используемые для описания статистических методов, и являются типичными мемами, которыми инфицированы многие авторы биомедицинских публикаций.

Часть используемых мемов вполне адекватно описывает несложный статистический инструментарий применяемый авторами. Однако подавляющее большинство меметических описаний несут на себе отпечаток фрагментарности и логической и вербальной незавершенности их конструкции. Фактически в этой ситуации автор уподобляется умельцу, которому в руки попал конструктор типа "Сделай сам" с набором тех или иных элементов, но при том, что в коробке отсутствует программа сборки нужного изделия. По этой причине часто наблюдается отстраненность и удаленность содержательной стороны выполненного анализа и его меметического описания. Нередко встречаются специфические "меметические цепочки" состоящие из дословно повторяющихся предложений следующих в ряду статей или диссертаций. Эта специфика может проявляться по-разному. Ниже мы рассмотрим несколько подобных специфических мемов, и обсудим их возможные инфекционные траектории.

В приведенной ниже таблице даны четыре авторских описания, относящиеся к определению ими достоверности различия. Три из них приведены в следующих диссертациях:

№1 - Лечение хронического описторхоза препаратом из растительного сырья (попутрилом) и оценка его эффективности. Канд. дисс., 14.00.09 - педиатрия, 1995г.;

№2 - Влияние некоторых стимуляторов центральной нервной системы на неспецифическую иммунобиологическую реактивность организма. Канд. дисс., 14.00.09 - инфекционные болезни, 1969г.;

№3 - Ультразвуковая и радионуклидная диагностика патологии гепатобилиарной системы у детей дошкольного возраста. Канд. диссер., 14.00.09 - педиатрия, 14.00.19 - лучевая диагностика,1997г.

Четвертое же описание приведено в коллективной монографии [102].

Те части мема, которыми наиболее отличаются данные описания, выделены жирным курсивом и цветом.

Описание из диссертации №1 [стр. 41]

Описание из диссертации №2 [cтр. 53]

Описание из монографии [102] [стр. 48]

Описание из диссертации №3 [стр. 40]

Достоверность различия сравниваемых величин определяли с помощью показателя точности Р по таблице Стьюдента, где он располагается в зависимости от значений t и n. Достоверность определяли с помощью абсолютного показателя точности "р", который находили по специальной таблице, где он расположен в зависимости от (t) Стьюдента и числа степеней свободы "n?". Достоверность различийсредних арифметических определяли по абсолютному показателю точности процентных точек распределения Стьюдента в зависимости от коэффициента достоверности (t) и числа степеней свободы (n). Достоверность различных средних арифметических определяли по абсолютному показателю точности (P) по таблице процентных точек распределения Стьюдента в зависимости от коэффициента достоверности (t) и числа степеней свободы (n).

Как видим, эти четыре описания весьма похожи друг на друга. Менее всего отличаются между собой описания из диссертаций №2-3 и монографии [102].

Наши исследования показали, что данный мем имеет достаточно большой "возраст". К примеру, если кандидатские диссертации №1 и №3 защищены в 1995г. и 1997г, а коллективная монография [102] издана в 1996г., то диссертация 2 датирована еще 1969г. Однако ни в одной из этих работ нет одного и того же исследователя, более одного раза выступающего в роли автора, либо в роли научного руководителя. Это делает более вероятным предположение о том, что "инфицирование" этим мемом произошло от некого пятого источника, носителя данного мема. Хотя не исключено, что некоторые из авторов упомянутых работ познакомились с ним и через предшествующие работы.

Обратим также внимание читателей на наличие в 4-х случаях субмема "показатель точности", причем в 3-х случаях он называется "абсолютным показателем точности". Наши попытки найти наиболее вероятный источник инфицирования этим мемом успеха не имели. Попытаемся выяснить, какой смысл могли вкладывать авторы этих работ в "показатель точности", используя для этой цели следующий мем, использованный в монографии [102] и диссертации №3 и приведенный в таблице ниже.

Описание из монографии [102]

Описание из диссертации №3

На основаниикритерия t по таблице Стьюдента определялась вероятность различия. Различие считалось достоверным при p < 0,05, т.е. в тех случаях, когда вероятность различия составляла больше 95%.[стр. 48] На основании t по таблице Стьюдента определялась вероятность различия (р). Различие считалось достоверным при p < 0,05, т.е. в тех случаях, когда вероятность различия составляла больше 95% . [стр. 40]

Авторы монографии [102] не приводят в этом меме объяснения величины (р). В этом случае можно считать, что авторы подразумевают под величиной (р) уровень значимости, и тогда в последнем предложении использованного мема нет противоречия. Действительно, "при p < 0,05" мы имеем доверительную вероятность более 95% . Таким образом, вероятнее всего авторы монографии [102] подразумевали уровень значимости, величина которого дополняет доверительную вероятность до единицы: р = 1 – Рдов. Совершенно иную, противоречивую и бессмысленную конструкцию имеет этот мем в диссертации №3, где величина (р) определяется как "вероятность различия". В одном и том же предложении диссертант утверждает, что "Различие считалось достоверным при p < 0,05, т.е. в тех случаях, когда вероятность различия составляла больше 95%". Таким образом, мы имеем случай рекомбинации мемов, в результате которой новый мутантный мем приобрел достаточно искаженную и лишенную смысла форму.

Если рассмотренные выше 4 источника относятся к разным областям медицинской науки, то следующие 2 диссертации - №4 и №5, объединяет не только одна научная специальность 14.00.37 – анестезиология и реаниматология, но и один научный руководитель.

№4 - Патогенетическое обоснование вариантов экстракорпоральной детоксикации в комплексной терапии токсической стадии острого разлитого перитонита (экспериментально-клиническое исследование). Канд. дисс., 14.00.37 – анестезиология и реаниматология, 1996г.

№5 - Экспериментальная оценка нового метода мембранного плазмафереза. Канд. дисс., 14.00.37 – анестезиология и реаниматология, 1998г.

№6 - Оптимизация лечения осложненных острых воспалительных заболеваний придатков матки у юных женщин). Канд. дисс., 14.00.01 – акушерство и гинекология, 1997г.

На первый взгляд различие же между этими мемами лишь в двух словах и одной букве. Однако главное

Описание из диссертации №4 [стр.59]

Описание из диссертации №5 [стр. 21]

Описание из диссертации №6 [стр.38]

Статистическая обработка результатов проводилась методом вариационной статистики с использованием "t"-критерия Стьюдента в условиях доверительной вероятности, равной 95% Статистическая обработка результатов проведена методами вариационной статистики с использованием "Т"-критерия Стьюдента в условиях доверительной вероятности, равной 95% Статистическая обработка полученных данных проводилась методом вариационной статистики с использованием "t"-критерия Стьюдента в условиях заданной доверительной вероятности, равной 95%

различие между ними в том, что авторы диссертаций №4 и №6 удовлетворились в своей работе только одним "методом" вариационной статистики, тогда как в диссертации №5 использованы уже несколько "методов". Иными словами, первые два диссертанта полагают что "вариационная статистика" и представляет собой один единственный метод, отождествляя его с t-критерием Стьюдента. Третий же диссертант предполагает наличие нескольких методов, которые и необходимы для использования Т-критерия Стьюдента.

Как видим, эти две позиции имеют принципиальную разницу между собой. Вместе с тем, данные диссертации объединяет и субмем "в условиях доверительной вероятности", который достаточно верно выражает этот аспект описываемой процедуры.

Анализ публикаций показал, что достаточно широко используются оба типа мема, как тот, где постулируется наличие нескольких "методов", так и мем с наличием одного "метода". Отметим, что такое восприятие статистики авторами публикаций характерно не только для "вариационной статистики", но и для других видов статистики. "Статистическую обработку цифрового материала проводили по стандартному методу вариационной статистики на электронно-вычислительной машине ЕС-1033 …" - стр. 58 диссертации "Состояние легочной вентиляции и механики дыхания при острой пневмонии", 14.00.05 – внутренние болезни, 14.00.43 – пульмонология, 1990г. "В эксперименте различие показателей по сравнению с контролем и между возрастными группами оценивались методами вариационной и разностной статистики по критерию Стьюдента и считались достоверными при Р < 0,05" - стр. 46 диссертации "Функции почек и водно-солевой баланс у крыс при гипо- и гиперосмии в динамике беременности", 14.00.17 – нормальная физиология, 1992г. "Вычисление, обработку полученных результатов осуществляли методом математической статистики при помощи программируемого микрокалькулятора "Электроника МК-52" с использованием специальных программ" - стр. 43 диссертации "Регионарная вентиляция, кровоток, механизмы дыхания у здоровых людей, больных хроническим бронхитом и бронхиальной астмой", 14.00.05 – внутренние болезни, 14.00.16 – пат. физиология, 1994г. Интересно, как бы воспринял хирург следующее описание: "Внутриполостная операция производилась методом хирургии"?

Анализ мемов со сложной конструкцией не всегда позволяет достаточно надежно представить те понятия и их смысл, которые авторы пытаются описать с помощью рекомбинантных мемов. По своему языку и стилю такие описания нередко напоминают известные произведения А. Платонова "Котлован" и "Чевенгур". Приведем одно из подобных описаний содержащихся на стр. 30 диссертации "Клиника и дифференциальная диагностика инфекционых экзантем у детей", 14.00.09 - педиатрия, 14.00.10 - инфекционные болезни, 1998г. и сделаем попытку его анализа. "Для определения значимости выборочных показателей, оценки сущности двух или нескольких показателей, а также определения связи между явлениями, полученных(так в тексте, выделено нами - В.Л.) в результате выборочных иследований, были использованы следующие формулы: "...(далее идут формулы ошибки среднего, среднеквадратичного отклонения и t-критерия Стьюдента - В.Л.). Итак, каков же смысл первого утверждения - "определение значимости выборочных показателей"?

Предположим, что из выборки в 50 наблюдений мы получили выборочный показатель - среднее арифметическое значение систолического давления равное 90 мм рт ст. Что в таком случае мы должны понимать, согласно автору, под "значимостью выборочного показателя"? Как предлагает автор "оценить сущность двух или нескольких показателей", например того же среднего систолического и диастолического давления, содержания иммуноглобулинов, СОЭ и т.д. и какой смысл вкладывает автор в термин "сущность"? Не ясно и то, как собирается автор "определять связи между явлениями", поскольку ни в приводимых ниже формулах, ни в тексте диссертации об этом ничего не сказано. Продолжим авторский текст: "Пределы возможных колебаний (доверительные интервалы) средних величин, полученные в выборочном исследовании принимались равными удвоенной средней ошибке (+2m), что дает основание с вероятностью 95% отнести полученную закономерность ко всей генеральной совокупности".

Итак, в первой половине этого предложения автор пытается объяснить технологию построения им 95%-ных доверительных интервалов. Однако из его объяснения не ясно, какой смысл имеет величина (+2m). Является ли это величина шириной 95%-ного доверительного интервала, либо же это полуширина, и тогда полная ширина доверительного интервала равна 4m? Остановимся на первой версии, согласно которой весь доверительный интервал равен 2m. В этом случае, принимая что данный интервал является симметричным (на это указывает нам используемый автором критерий Стьюдента, а стало быть распределение вероятностей подчиняется нормальному закону), получим, что левая граница интервала будет равна (Хср.-1m), а правая граница интервала будет равна Хср.+1m. Тогда полуширина доверительного интервала будет равна 1m. Но тогда для построения 95%-ного двустороннего доверительного интервала необходимо использовать квантиль уровня 0,975 , который не может быть равен 1 даже для таких объемов выборок, которые равны нескольким сотням и тысячам. Так для бесконечно большого объема выборки он равен 1, 96, для выборки объемом 60 наблюдений соответствующий t-квантиль распределения Стьюдента будет равен 2. Но в этом случае вся ширина для 95%-ного доверительного интервала будет равна учетверненному значению m, а не удвоенному. Итак, какой же доверительный интервал строит диссертант и для каких обхемов выборок? Не меньше вопросов возникает и при изучении второй половины данного предложения, в которой речь идет о "полученной закономерности", поскольку ранее нигде автор ничего не говорит ни о видах закономерностей, ни о методах их оценки.

Рассмотрим еще один пример такого сложного мема, синтезированного из нескольких субмемов. "Полученные результаты обработаны методом вариационной статистики с применением t-критерия Стьюдента, Х-квадрат и метода ранжирования непараметрических данных." (статья "Особенности терапии верапамилом, нитратами и корватоном у больных со стенокардией в сочетании с гипотонией", Сибирский медицинский журнал, N2, 1996г., стр. 26.). Первая часть этого мема сообщает об использовании вариационной статистики. Хотя это название и является уже устаревшим (см. например, книгу П.Ф.Рокицкого "Биологическая статистика" (1973г.), где он объясняет свой отказ от прежнего названия "Вариационная статистика"), однако само по себе оно не конфликтует с остальным содержанием мема и статьи. Однако упоминание о t-критерии Стьюдента уже требует выполнения двух обязательных условий, о чем ни в данном меме, ни в самом тексте статьи ничего не сообщается. Из чего можно сделать достаточно обоснованное предположение о том, что авторы не проверяли эти условия. Далее, обратимся к результатам проверки гипотез о равенстве средних в группах, приведенным в таблицах 1-3 на стр. 29. В табл. 1 речь идет о числе приступов стенокардии, т.е. о дискретной величине. Такая же дискретная величина и в табл.3 - число гипоперфузируемых сегментов. По причине дискретности этих величин, имеющих достаточно ограниченное число значений, применение t-критерия Стьюдента невозможно. И только в табл. 2 речь идет о непрерывной величине - продолжительности (времени) пороговой нагрузки, и поэтому в принципе, при выполнении известных ограничений, в данном случае применение t-критерия Стьюдента возможно. Однако остается вопрос, как же проверялись гипотезы в табл. 1 и 3? В анализируемом меме после t-критерия Стьюдента речь идет о критерии "Х-квадрат". Предполагая, что при наборе текста вместо греческой буквы "Хи" была набрана латинская буква "Х", можно далее предположить, что здесь речь идет о критерии "Хи-квадрат". Однако этот критерий не используется для проверки подобных гипотез. Неясно тогда какие же гипотезы и в каких случаях проверялись с его помощью, поскольку в тексте статьи о них ничего не сообщается. Далее в тексте мема упоминается "метод ранжирований непараметрических данных".Что такое "непараметрические данные" видимо известно только кому-то из 8 соавторов этой статьи. Поскольку и в "вариационной статистике", как и в математической статистике, отсутствует такое понятие, как "непараметрические данные"[107, 108]. Итак, какими же статистическими критериями получены выводы в табл. 1 и 3 и что такое "непараметрические данные"?

Еще один пример мема не поддающегося анализу. "Для исследования соотношения определяемых факторов использовался многоуровневый корреляционный анализ" - стр. 21 диссертации "Состояние местного иммунитета при язвенной болезни", 14.00.05 - внутренние болезни, 1994г. Ни контекст этого мема, ни содержание диссертации никак не расшифровывают, что подразумевал диссертант под "многоуровневым корреляционным анализом". Можно предположить, что корреляционный анализ выполнялся последовательно на разных уровнях (в разных иерархически расположенных группах) и затем коэффициенты корреляции для одних и тех же пар признаков разных уровней сравнивались между собой. Однако изложенные в диссертации результаты исследования не содержат ни таких уровней, ни сравнения разноуровневых коэффициентов корреляции.

Во многих работах само понятие "закономерности" для авторов ассоциировало с понятием функции и функциональной связи. В частности, нередко в тех местах своего описания, где автор вел речь об оценке зависимостей между различными изучаемыми показателями, наблюдались рекомбинации со словосочетаниями "функциональная зависимость" или "функциональная связь". "Функциональная зависимость между показателями определялась с помощью корреляционного и регрессионного анализа" - стр. 46 диссертации "Функции почек и водно-солевой баланс у крыс при гипо- и гиперосмии в динамике беременности", 14.00.17 - нормальная физиология, 1992г. "Функциональная связь при коэффициенте корреляции (r) до 0,5 оценивалась как слабая, 0,5 - 0,7 средняя, 0,7 - 0,9 сильная и от 0,9 до 1,0 как тесная" - стр. 50 диссертации "Особенности регуляторно-метаболических параметров иммунокомпетентных клеток крови у лиц с разным соматотипом", 14.00.17 - нормальная физиология, 1997г. Элементарное представление о функции сейчас изучается в начальной школе. Обратимся к статье "Функция" в "Советском энциклопедическом словаре" (1982г., стр. 1449): "Функция (матем.), 1) зависимая переменная величина. 2) Соответствие y=f(x) между переменными величинами, в силу которого каждому рассматриваемому значению некоторой величины х(аргумента, или независимого переменного) соответствует определенное значение другой величины y (зависимой переменной, или функции). Такое соответствие может быть задано различным образом, например, формулой, графически или таблицей (типа таблицы логарифмов)." Теперь обратимся к статье "Корреляция" на стр. 642 этого же словаря: "Корреляция (в матем. статистике), вероятностная или статистическая зависимость. В отличие от функциональной зависимости корреляция возникает тогда, когда зависимость одного из признаков от другого осложняется наличием ряда случайных факторов". Аналогичным же образом определяется этот термин и в "Статистическом словаре" (1989г., стр. 213): " Корреляция - зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой". Итак, функциональная зависимость и корреляционная или регрессионная зависимости являются антиподами. В живых организмах, как наиболее сложных природных творениях, практически не встречаются функциональные зависимости в чистом виде, а преобладают именно вероятностные, статистические. И именно по этой причине столь необходима прикладная статистика как инструмент исследования в биомедицине.

Наиболее частая конструкция рекомбинированного мема описания состоит из двух или трех ядер. В одном из них, обычно в первом ядре, упоминается сам факт использования ЭВМ или персонального компьютера. В следующем ядре упоминается название одного или нескольких статистических методов. И завершает эту конструкцию упоминание названия статистического пакета. Как правило, при использовании подобных рекомбинированных мемов далее в тексте авторы уже не возвращаются к их содержимому. Например, выше мы уже упоминали статью "Использование эссенциальных фосфолипидов в лечении больных ишемической болезнью сердца и инсулиннезависимым сахарным диабетом" (Кардиология, 1996, N1, стр. 30-33), где все описание имеет следующий вид(стр.31): "Полученные данные обрабатывали на ЭВМ методами многомерной статистики".

Однако отсутствие в тексте статьи даже намеков на эти самые "многомерные методы" и обсуждения результатов их применения, позволяют высказать вполне обоснованное предположение о том, что данное описание является не более чем камуфляжным мемом. Наличие таких мемов в статьях журнала "Кардиология" не является какой-то редкостью, несмотря на требования самой редакции журнала о детальном описании авторами статей использованных ими статистических методов.

[Назад] [Оглавление] [Вперед]

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ.