Яндекс.Метрика МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИССЛЕДОВАНИЙ В ПСИХИАТРИИ
Каждый слышит то, что понимает. Гете Трудных наук нет, есть только трудные изложения. А.И. Герцен. Часть материалов сайта доступна только подписчикам. На период подписки они имеют возможность оперативной консультации по статистическому анализу биомедицинских данных. Запрос на подписку направляйте редактору БИОМЕТРИКИ.
"Вопросы психиатрии", 1996.- т.96.- с.94-100
МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИССЛЕДОВАНИЙ В ПСИХИАТРИИ
А. В. Немцов, Н. А. Зорин

Отдел информатики и системных исследований
ГНЦ психиатрии и наркологии МЗ РФ

Одна из характерных особенностей науки второй половины XX века - почти тотальная математизация. Главная причина этого - стремление повысить точность знания в связи с повышением социальной значимости научных решений. Важную роль играет также расширение взаимодействия различных отраслей науки, для которых математика является универсальным языком общения.

Науки о человеке были не последними в освоении математики. На этот путь еще в конце XIX века встала психология, позднее - социология и лингвистика. Психиатрия также накопила собственный опыт, который в 1985 г. был обобщен в сборнике, выпущенном к 100-летаю Международного статистического общества.

Одна из статей сборника [2] представляла собой обзор использования математических методов в психиатрии. В качестве иллюстрации проанализированы 784 статьи из англоязычных психиатрических журналов (АП): American Journal of Psychiatry, Вritish Journal of Psychiatry и Archives of General Psychiatry за 1980 г.

Авторы обзора, указывая на широту применяемых методов, нетривиальность приложения части из них, вместе с тем отметили большое число упущенных возможностей. Критическое отношение вызвало также понимание статистической значимости в психиатрической литературе, произвольность выбора уровней "0,05" и "0.01", отсутствие даже попыток сопоставить статистическую и практическую значимость. В обзоре не анализировались статистические ошибки в статьях по психиатрии. Но это было сделано в другом исследовании [3]. Оказалось, что доля таких ошибок, повлиявших на правильность выводов, довольно высока - около 1/3. Авторы отмечали, что ситуация в психиатрической литературе не является исключительной; сходное положение существовало, например, и в экономической литературе [4].

Обзор дал возможность сопоставить отечественный опыт в этой области с международным. В 1990 г. это было сделано в отношении "Журнала невропатологии и Психиатрии им. С.С.Корсакова" (ЖК), за 1979-1981 и 1987гг. [1]. Было проанализировано 867 психиатрических статей ЖК, которые были распределены в соответствии со статистическими категориями, представленными в [2]. Результаты воспроизведены в таблице и на рисунке (две первые категории в статье [2], не содержавшие статистических данных, были объединены).

Анализ ЖК показал, что использование статистических методов в российском журнале существенно уступало АП.

В настоящее время в России существует уже несколько новых психиатрических журналов, существенно расширился диапазон публикаций, исследовательская психиатрия оснастилась компьютерами, с помощью которых легко использовать пакеты стандартных статистических программ. Можно было ожидать существенного расширения использования математических методов. Проверка этого предположения стала главной целью настоящего исследования.

К сожалению, в ЖК в последние годы доля психиатрических статей резко сократилась по сравнению с неврологическими, что затрудняет сравнение. Поэтому для анализа был взят журнал "Социальная и клиническая психиатрия" (СКП).

1. Количественное сравнение

По тем же принципам, что и в статьях [1] и [2], были проанализированы 420 статей, напечатанных во всех номерах СКП, вышедших в 1991-1995 гг. 

Результаты представлены в таблице и графике, на которых видно, что распределение частоты использования статистических методов в СКП практически полностью совпадает с распределением работ в ЖК. Появилось лишь несколько работ с использованием регрессионного и дискриминантного анализа (категории 8 и 9). При этом оказалось, что 3/4 этих статей написаны иностранными авторами. 

В таблице указана статистическая значимость различий использования отдельных статистических методов (категорий) в статьях русскоязычных и англоязычных авторов. Различия распределений в целом превышают самые высокие попарные различия.

Таблица 1
Использование статистических методов в публикациях психиатрических журналов
Характеристика методов АП

1980

ЖК

1979-1981 и 1987

СКП 1991-1995 Отличие от АП
ЖК

p<

СКР

р<

1. Описательные сообщения и обзоры 157 500 225 0,0001 0,0001
2. Описательная статистика: таблицы, графики, средние, вариабельность 90 178 113 0,0001 0,0001
3.Xи2, t-тесты, метод Фишера 236 149 67 0,0001 0,0001
4. Корреляционные методы 94 27 6 0,0001 0,0001
5. Частотный анализ, F-тест 79 2 1 0,0001 0,0001
6. Непараметрические ранговые методы 36 1 0 0,0001 0,0001
7. Измерение связей некорреляционными методами 32 1 0 0,0001 0,0001
8. Регрессионный анализ 25 2 5 0,0001 0,001
9. Дискриминантный и факторный анализы 17 5 2 0,05 0,05
10. Оценка максимальной вероятности, интервальные оценки 5 0 1 0,01 ___
11. Кластерный анализ, классификации 2 2 0 ___ ___
12. Анализ "выживаемости" 3 0 0 0,05 0,05
13. Сериальный и спектральный анализы 3 0 0 0,05 0,05
14. Планирование эксперимента: латинские квадраты, иерархические модели 4 0 0 0,01 0,05
15. Байесовы методы 1 0 0 ___ ___
16. Всего статей 784 867 420    
АП - англоязычные журналы (Аmer.J.Psychiat., British J. Psychiat., Archives Gen. Psychiat.)
ЖК - Журнал невропатологии и психиатрии им. С.С.Корсакова 
СКП - Социальная и клиническая психиатрия
 
 

a1.gif (10522 bytes)






Рис. Распределение статистических методов в статьях психиатрических журналов.

АП – англоязычные психиатрические журналы в 1980 г. (784 статъи)
ЖК - "Журнал невропатологии и психиатрии им. С.С.Корсакова" в1979-1981 и 1987гг.(8б7 статей)
СКП - журнал "Социалъная и клиническая психиатрия" в 1991-1995 гг. (420 статей). 
Абсцисса - категории используемых методов (указаны в таблице; категории 12-15 на график не нанесены).

Следует отметить, что с 1992 по 1995 гг. происходило прогредиентное нарастание доли статей, использующих методы математической статистики (с 14,1% до 25,0%), однако это различие еще не достигло уровня статистической значимости (р>0,05).

2. Качественная оценка

Помимо количественного сравнения был проделан качественный анализ использования математических методов в статьях российских авторов в СКП. При этом важно было ответить на следующие вопросы:

  • как определялась цель использования количественных методов,
  • адекватно ли цели выбирались математические методы,
  • адекватно ли материалу методы использовались,
  • что они дали для выводов, была ли цель достигнута и, наконец,
  • какие возможности были упущены, иначе говоря, могло бы использование математических методов повысить надежность выводов.
Для ответа на эти вопросы проанализированы статьи СКП за 1994 г. (всего 91), когда количество статей, использующих методы математической статистики, достигло 20,4%. 

Главная трудность анализа использования количественных методов в СКП лежит вне математики, в смысловой организации большей части работы, в их семантике. Это, прежде всего, - нечеткость формулировки цели и задач, как работы в целом, так и отдельных ее фрагментов, в частности, статистических, которые часто даются без какой-либо мотивировки и последующего обсуждения, то есть, используются формально.

Последнее особенно наглядно в тех работах, где существовал раздел "материалы и методы". В этом разделе иногда не было даже упоминаний о методах математической статистики, которые затем появлялись в тексте без какого-либо объяснения. Если же указания на такие методы и были, ни в одной работе не встретилось объяснения, почему выбраны именно эти методы, а не другие, и что с их помощью предполагалось получить. Эти особенности многих работ помешали ответить на первые два из поставленных выше вопросов и оценить в полной мере адекватность применения статистических методов.

Результаты анализа сгруппированы в виде описания наиболее частых погрешностей.

а. Прежде всего, обращает внимание резкое доминирование t-оценок в статьях СКП, которые почти полностью исчерпывают категорию 3 (см. таблицу) в отличие от АП, где широко используется метод хи-квадрат и дискриминантный анализ. Существенно отметить и то, что метод Стьюдента используется в статьях СКП без какого-либо анализа его приложимости. Между тем этот метод разработан для показателей, имеющих нормальное (в первом приближении - симметричное) распределение, тогда как количественные данные некоторых статей показывают, что это условие не выполняется. А это значит, что неприменима не только t-статистика, но также вычисление средней величины, которая в случае асимметричного распределения оказывается смещенной. В таких случаях для описания центральных тенденций обычно используется медиана и медианные критерии различия, а также другие непараметрические статистики, которые давно и широко вошли в исследовательскую практику.

Продолжается практика всерьез осуждать в качестве "тенденции" различия данных, незначимых по критерию Стьюдента. Между тем даже значимые различия, например, на уровне р=0,05, предполагают, что следующая выборка того же объема с вероятностью 5% может иметь обратную тенденцию.

б. Большинство статей, где используется t-статистика, имеет многофакторную
структуру. В подавляющей части таких работ предполагалось обнаружить зависимость одного (например, прогноза) или нескольких явлений (например, диагностические группы) от каких-либо нескольких факторов (клинических, лабораторных, социальных и других или от типов течения определенной нозологической формы). Казалось, было очевидным решать эти задачи с помощью многофакторных математических методов, таких, например, как дисперсионный, факторный, дискриминантный, кластерный анализ или множественная регрессия. Однако за редчайшим исключением авторы опираются на t-статистику, иногда умножая ошибки, указанные в пункте "а".

В некоторых работах поражает разрыв между трудоемкостью сложноструктурированного, добротно выполненного исследования и простотой статистической обработки многопараметрических результатов, основанной на t-статистике, которая оказывается не вполне адекватной задаче исследования. В случае применения одного из перечисленных выше методов можно было бы показать, например, не только различие пациентов, но весовой вклад отдельных параметров в это различие.

в. Отдельную и очень большую группу составили работы, в которых статистика
или вовсе не использовалась или была представлена только числовой характеристикой некоторых показателей. К значительной части этой группы статей относится замечание "б" об использовании многофакторных методов, особенно в тех случаях, когда изучаемые явления имели в статье количественное выражение, иногда значительное.

В этих работах описание материала, выраженное в цифрах, часто носило рутинный характер вне связи с целями исследования. Например, перечислялись характеристики пола больных, их возраста, часто с 10-летними интервалами, хотя принцип такой разбивки не излагался. Часто давались также частотные характеристики образования, семейного и социального положения, инвалидности и т. д. При этом многое параметры имели еще и внутренние градации. Однако, ни в обсуждении, ни в выводах эти данные не находили отражения, и трудно было понять, какое отношение они имели к цели или задачам исследования.

Никак не обосновывался объем выборки и его достаточность. Во многих работах отсутствуют средние значения возраста обследованных. Лишь однажды показано, что половозрастное распределение больных совпадает с данными других авторов и таким образом является подтверждением репрезентативности выборки по отношению к общей популяции больных с анализируемой патологией. 

Для статей этой группы типичным было то, что выбор перечисленных выше и некоторых других характеристик никак не объяснялся. Более того, нередко ни один из приводимых факторов в дальнейшем не анализировался и не обсуждался, хотя, казалось бы, что перечисление и количественная характеристика показателей предполагает возможность их влияния на изучаемое явление (например, на социальную адаптацию), что можно было определить с помощью корреляционных или дискриминантных методов. 

В одной из работ описывается воздействие 9 факторов и 24 возможных исхода для выявления связи между ними. Такое количество переменных превышает дифференциальные возможности наблюдателя и обязательно требует использования методов многомерной статистики. Однако статья не содержит ни количественных данных, ни тем более их статистической обработки. Совершенно ясно, что научная ценность такой работы исчезающе мала - не потому, что ее описательные выводы обязательно неверны, но, будучи недоказательными, становятся научным балластом. 

3. Обсуждение

Почти полное совпадение распределений 1979-1987 (ЖК) и 1991-1995 гг. (СКП) показывает, что отношение к математическим методам в исследовательской психиатрии не изменилось за последние 1,5 десятилетия. Скорее всего, это означает устойчивость ментальности научного сообщества. Очевидно также, что компьютеризация исследовательских учреждений в последние годы не повлияла на расширение измерительных или количественных подходов. Как и в прошлом веке, в российской психиатрии доминируют описательные, качественные методы. 

Тут уместно поставить вопрос: хорошо это или плохо? Сомнительно, чтобы ответ был однозначным, тем более что преобладающая часть психиатрии, практическая помощь населению, построена на принципе качественного описания психиатрических явлений. В связи с этим очевидно, что как бы ни развивалась в дальнейшем научная психиатрия, часть ее практических рекомендаций будет написана языком качественных категорий. Однако другая часть уже сейчас имеет количественный или полуколичественный характер (например, дозы препаратов, ранжирование их эффективности). С расширением круга препаратов клиническая психофармакология и дальше будет расширять количественные подходы в практической психиатрии, не говоря уже об исследовательской ее части, для которой повышение точности знания остается важной задачей.

Характерно, что психофармакология оказалась тем разделом психиатрии, который дальше других продвинулся в деле использования математических методов. Это обусловлено прежде всего ответственностью ее практических решений, а также дороговизной ее производства и конкуренцией на рынке сбыта. Жесткость всех этих отношений заставила психофармакологов насытить математикой не только теоретический, но и прикладной раздел этой дисциплины (клиническое испытание новых препаратов). Почти тотальное обеспечение психофармакологии математикой стало одним из способов повышения ее эффективности и минимизации неудач. Анализ литературы, предпринятый в (2) показывает, что та же задача уже стояла перед всей англоязычной психиатрией на рубеже 1970-1980 гг. Анализ, предпринятый в настоящей работе, свидетельствует, что аналогичная задача еще не возникла перед российской психиатрией в середине 1990-х гг. Более того, часть российских статей по изучению эффективности психотропных препаратов или их сравнительному изучению, даже содержащие количественные данные, обходятся без статистического анализа, лишь изредка используется t-статистика. Хорошо это или плохо, когда рекомендации по массовому использованию психотропных препаратов защищены только наблюдательностью клинициста? 

Следует специально отметить, что многие клинические характеристики, приводимые в анализируемых статьях, могли быть подвергнуты измерению, так как они представляют собой принципиально количественные, иначе говоря, измеряемые значения (например, "увеличение" или "снижение" какого-либо показателя). Качественное упоминание этих количественных свойств превращает статью в разновидность констатирующего текста и лишает ее дополнительной доказательности.

В тех же статьях, где статистические методы используются, нет четкого понимания, зачем это делается. Между тем все анализируемые работы – выборочные исследования, как правило, с небольшим объемом выборки. Это – классическая область прикладной математической статистики, которая служит способом распространения локальных выводов, сделанных на основе ограниченной выборки, на генеральную совокупность (как правило, популяцию больных с той или другой патологией). 

Конечно, у статистики есть и некоторые другие задачи, но это - главная, и во всех анализируемых работах по сути дела решается именно она. Статистическая точность выводов с помощью уровня значимости - это и есть соотнесение результатов работы со свойствами генеральной совокупности. Символы "0,05" и "0.01" - суть пропуск в популяцию, знаки того, как выводы статьи будут "работать" в генеральной совокупности. К сожалению, эта задача часто решается формально, а поэтому - иногда неверно или с большими погрешностями. Вместе с тем следует иметь в виду, что адекватное применение статистических методов - необходимая, но недостаточная защита правильности научных выводов на основе выборочного исследования. Необходимо, чтобы эти методы были наложены на результаты корректно спланированного и выполненного исследования. 

Слабое обеспечение статей СКП математической статистикой является лишь одним проявлением более общего явления - низкого уровня подготовки исследователей в области психиатрии, который мало изменился с начала 1980-х и значительно отстает от зарубежного. В связи с этим, как и прежде, перед российской психиатрической наукой очень остро стоят три взаимосвязанные проблемы: контроль, репрезентативность выборки и выход исследований за пределы не только стационара, но и амбулаторного наблюдения. Важная задача - повышение квалификации научных кадров, осознание того, что научная и клиническая квалификация - это не одно и то же и совсем не всегда идут рука об руку. Без решения этих задач, а также математизации исследований, российская психиатрия еще долго будет отстающей областью знания.

Однако на этот печальный пейзаж можно посмотреть с другой стороны, и тогда помимо описания состояния исследований в психиатрии потребуется его более широкая оценка. Для этого следует принять во внимание, в частности, условия социально-экономического кризиса, который переживает наша страна и наука. В этом контексте может быть станет важным то, что уровень написания статей, по меньшей мере - их математическое обеспечение, не снизилось по сравнению с началом 1980-х годов. Выбор точки зрения тут не может быть произвольным и зависит от многих переменных, но в первую очередь - от изменения соотношения материального обеспечения науки и ее продуктивности при сравнении российских и мировых тенденций. Чтобы решить эту проблему, потребуется, конечно, специальное исследование.

ЛИТЕРАТУРА

1. Бесчастный А. А., Немцов А. В.//Журн. Невропат. Психиатр. - 1990. -Т. 90. -С. 144-146.
2. De Groot M.H., Mezzich J.E.//A celebration of statistics/Eds. A.C.Atkinson, E.Fienberg.- New York, 1985. - Р. 145-165.
3. Wite S.G.//Brit. J. Psychiat.- 1979.- Vol.135.- P.336-342.
4. Zellner A.//Proceeding Business and Economy. Statistical Section of Amer. Ass.- New York, 1980.- P.199-203.


Наш адрес:

1997 - 2017.© Василий Леонов
 

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ.
Rambler's Top100