Яндекс.Метрика

Логистическая регрессия в медицине

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
". Д. Дидро

Статистика посещаемости БИОМЕТРИКИ Яндекс
цитирования
Индекс цитирования

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
Яндекс
цитирования
Яндекс цитирования
 

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят...


Введение
Наши возможности. О возможностях статистического анализа
Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35
Список научных и учебных изданий по биометрике и статистике
Материалы по науковедению
История биометрики
Статистическое рецензирование статей и диссертаций

Долгое прощание с лысенковщиной...
Семинар по биометрике в Красноярске



Если Вы сторонник использования
статистики, разместите на своём сайте
HTML-код нашего баннера:

BIOMETRICA - журнал для сторонников доказательной биологии и медицины
25 наиболее популярных ссылок, посещаемых нашими читателями
http://www.biometrica.tomsk.ru/comp_aver.htm
http://www.biometrica.tomsk.ru/erevan_8.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/UNESCO%202010.pdf
http://www.biometrica.tomsk.ru/zakaz.htm
http://www.biometrica.tomsk.ru/zakaz_28.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/STAT_CARDIO_2014.pdf
http://www.biometrica.tomsk.ru/logit_9.htm
http://www.biometrica.tomsk.ru/stat_cardio7.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/percent_00.htm
http://www.biometrica.tomsk.ru/lis.htm
http://www.biometrica.tomsk.ru/kamchat.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/zakaz_15.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

БИОМЕТРИКА + Музыка. В. Леонов.

Музыка... Вот что сказал о ней великий Иоганн Себастьян Бах: "Цель музыки - трогать сердца". В детстве автор этих строк получил музыкальное образование. Любимыми инструментами были мандолина и гитара. Любимыми композиторами - Вивальди, Бах, Альбиони, Боккерини, Беллини, Корелли, Скарлатти. В 80-е годы прошлого столетия в Томск часто приезжал с концертами маэстро Владимир Спиваков. Эти концерты организовывал Егор Лигачёв, бывший в ту пору первым секретарём Томского обкома КПСС. На свой первый концерт в Томск Владимир Спиваков приехал один. Великолепно играл на скрипке! Концертный зал был переполнен слушателями, которые были в восторге от его концерта. Именно тогда мне удалось впервые встретиться с ним, и взять у него автографы на его грампластинки. В дальнейшем посещал все его концерты. В 1979 г. В. Спиваков организовал камерный оркестр "Виртуозы Москвы". Однажды в 90-е годы Владимир Спиваков должен был приехать в Томск с "Виртуозами Москвы", и в течение трёх дней дать 3 концерта. Однако из-за проблем с топливом в те времена, их самолёт посадили в Омске, где они пробыли 2 дня. И когда прилетели в Томск, то в один день провели все 3 концерта, которые я прослушал. И вновь взял автографы на новые грампластинки, и сделал много фотографий В. Спивакова.


Музыка...  Она помогает всегда. Вот почему я рассылаю почти всем своим корреспондентам файлы с хорошей музыкой. Любите музыку, слушайте её чаще. И она поможет лучше понимать бистатистику и результаты статистического анализа...

13 февраля 2014 г. Владимир Спиваков и "Виртуозы Москвы" дали концерт в Краснодаре. Я посетил этот прекрасный концерт, и вновь встретился с Владимиром Теодоровичем. Подарил ему его грампластики, фотографии, и свою книгу.

Логистическая регрессия в медицине и биологии

В. Леонов

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5. Особенности логистической регрессии в акушерстве.
6. Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество уравнений логистической регрессии.


В данной серии статей, на уровне доступном для начинающих, рассмотрены основы логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Объяснено, что методу присуща множественность решений, что позволяет выбирать для использования в реальной врачебной практике наиболее удобные и надёжные тактики лечения. Рассмотрено использование метода к массивам данных, содержащим несколько сотен признаков. Показано, что корректное создание таких массивов и их анализ возможны лишь при участии биостатистиков на самых первых этапах таких исследований. Рассмотрена связь логистической регрессии и ROC-анализа. Приведены многочисленные уравнения логистической регрессии и ROC-кривые, полученные при анализе реальных данных. Объяснена целесообразность использования вместе с методом логистической регрессии набора методов анализа парных взаимосвязей между различными признаками, а также использование более сложных методов многомерной статистики

 

 

Пример использования логистической регрессии
для расчёта прогноза исхода оперативного лечения.

Леонов В.П., Шнейдер В.Э. 1

(1: доцент кафедры госпитальной хирургии Тюменской государственной медицинской академии, к.м.н., E-mail: w_schneider@mail.ru )

Подобно тому как все искусства
тяготеют к музыке,
все науки стремятся к математике.
__________________________
Д. Сантаяна

Целью исследования было выявления факторов риска для определения прогноза развития неблагоприятных исходов хирургического лечения травматических повреждений поджелудочной железы. Какие из этих факторов позволяют определить прогноз развития послеоперационных осложнений и летальности после операций по поводу травмы поджелудочной железы, остаётся до конца не выясненным.

В работе проводится анализ 35 количественных и 115 качественных признаков. База данных основана на 202 наблюдениях. Для каждого случая травматического повреждения поджелудочной железы учитывались следующие наборы признаков, из которой формировалась база данных (БД): 1) демографические данные; 2) вид, механизм и давность повреждений; 3) степень тяжести состояния пациента; 4) степень тяжести повреждений; 5) количество повреждённых органов; 6) объём кровопотери; 7) способ хирургического лечения; 8) осложнения; 9) летальность; 10) данные лабораторного исследования при поступлении и в динамике послеоперационного периода (ферменты поджелудочной железы, глюкоза, лейкоцитоз, ЛИИ и др.), и многие другие.  Оценку тяжести состояния больных и степени тяжести повреждений проводили по шкале комы Глазго (GCS), шкалам  APACHE II и  SAPS II, физиологическому показателю тяжести травмы (RTS), анатомическому показателю тяжести травмы NISS, шкале повреждений AIS, шкале комплексной оценки тяжести состояния «ВПХ–СП» и шкале оценки тяжести повреждений «ВПХ–П».

Для прогнозирования на основе анализа множества факторов, обладающих сетью взаимных влияний друг на друга, необходимо использовать методы многомерной статистики. Для достижения поставленной цели исследования была использована логистическая регрессия.

Первым этапом необходимо было выявить влияние каждого фактора на развитие послеоперационных осложнений и их парные взаимосвязи друг с другом. Для этого были использованы следующие 3 вида анализа – корреляционный, анализ таблиц сопряжённости и сравнение центральных мер нескольких групп. Учитывая наличие ранговых переменных, для оценки интенсивности корреляционных связей использовали коэффициент корреляции Спирмэна. Раздельное выполнение корреляционного анализа в основных группах сравнения позволяло установить, каким образом принадлежность пациентов к той или иной подгруппе сравнения изменяет структуру корреляционных матриц. В частности, для каких пар признаков величина корреляционных коэффициентов увеличивалась, или уменьшалась. А также установить, какие пары признаков приобретали или теряли статистически значимую корреляционную взаимосвязь.

Для сравнения групповых центральных мер предварительно проводилась проверка нормальности распределения количественных признаков с помощью статистических критериев Шапиро-Уилка, Колмогорова-Смирнова, Крамера фон Мизеса и Андерсона-Дарлинга. Поскольку большая доля гипотез о нормальности распределения отвергалась, то помимо использования параметрических методов сравнения, использовались также следующие непараметрические критерии: Ван дер Вардена, Краскела-Уоллеса, и медианный критерий. В том случае, когда анализ таблиц сопряжённости обнаруживал наличие статистически значимой взаимосвязи между парой качественных признаков, проводился анализ структуры этой связи в анализируемой таблице. Благодаря такому анализу устанавливались те сочетания градаций этих признаков, которые и были ответственны за данную взаимосвязь. Кроме того устанавливались в отдельных клетках таблицах направления этих связей. Такая детализация результатов анализа позволяла в дальнейшем рассмотреть различные варианты изменения структуры градаций анализируемых признаков.

Все 3 перечисленных выше вида анализа парных взаимосвязей были необходимы, в том числе, для лучшего понимания влияния отдельных предикторов, входящих в уравнения логистической регрессии, на зависимую группирующую переменную.  


После этого производилась оценка набора уравнений логистической регрессии. Учитывая тот факт, что в реальной исследовательской практике у части анализируемых признаков всегда имеется небольшая доля пропущенных (неизмеренных) значений, возникает необходимость выбора различных подмножеств потенциальных предикторов. Поскольку при одновременном участии в списке потенциальных предикторов всех признаков БД, существенно уменьшается число анализируемых наблюдений. Это объясняется тем, что в анализе могут быть использованы только те наблюдения, у которых есть измерения по всему списку потенциальных предикторов. Такие альтернативные варианты делают неизбежным получение в результате анализа не единственного, уникального уравнения, а некоторого набора уравнений. Это подмножество полученных уравнений объясняется не только наличием отличающихся наборов потенциальных предикторов, из которых производится отбор полезных, информативных признаков, но также и использованием различных алгоритмов такого отбора. В итоге общее количество полученных уравнений логистической регрессии может от 3-5 возрастать и до нескольких десятков, и даже более. Поэтому по окончании анализа и получения такого подмножества уравнений логистической регрессии возникает последующая задача выбора наиболее ценных и полезных уравнений.
Рассмотрим также ещё одну особенность формирования наборов потенциальных предикторов для отбора из них предикторов в уравнения логистической регрессии.

Очень многие массивы данных, собираемые в медицинских исследованиях, содержат группу одинаковых признаков, фиксируемых в различные периоды наблюдения за пациентами. Например, при поступлении пациента первоначально фиксируются показатели анамнеза, а также начальные результаты различных видов анализа. Затем уже в динамике фиксируются наборы одинаковых признаков. Наконец в самой последний период наблюдения фиксируются не только результаты анализа, но и конечный результат лечения в целом. Это могут быть бинарные исходы (нелетальный исход, или летальный исход), либо исходы с 3 и более градациями. Например, несколько видов послеоперационных осложнений, и т.п.

При наличии таких динамических БД, принимая в качестве зависимой переменной результат лечения, возникает 2 подхода, как к построению самой БД, так и оценке уравнений логистической регрессии. В этом случае целесообразно использовать 2 способа формирования БД. В первом случае матрица данных (например, в пакете EXCEL) формируется «слева – направо». Т.е. вначале вводятся столбцы с показателями анамнеза, а далее группы признаков (столбцов) фиксируемые в разные периоды лечения. Ниже представлена схема такой БД.

 

 

Анамнез

 

1-й период

 

2-й период

 

Исход

Number

A1

A2

A…

B1

B2

B…

C1

C2

C…

D1

D2

D…

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь:  Number – номер наблюдения (пациента) в БД, Аi – признаки анамнеза,  Вi – признаки фиксируемые в первом периоде,  Сi – признаки фиксируемые во втором периоде, Di – признаки фиксируемые в последнем периоде.  
В этом случае для оценки прогноза исхода лечения в каждом текущем периоде наблюдения целесообразно использовать следующие комбинации подгрупп признаков:

  1. А+В;
  2. А+В+С
  3. А+В+С+D.

При этом комбинация А+В будет использоваться для оценки уравнения прогноза исхода в 1-м периоде. Комбинация А+В+С для прогноза исхода во  2-м периоде, и т.д.

Однако при оценке уравнений связи между показателем исхода и другими показателями преследуется двоякая цель. С одной стороны, это попытка получить  выражения для прогноза исхода. И анализируя в этих уравнениях структуру предикторов (знаки коэффициентов предикторов, а также ранги стандартизованных коэффициентов уравнения) выделять те признаки, которые поддаются реальному изменению в нужную сторону (увеличение или уменьшение). И далее, установив ожидаемую комбинацию значений всех предикторов уравнения, в т.ч. после воздействия на управляемые признаки, оценить вероятности исходов лечения.

Иными словами, такие уравнения в принципе должны помочь в выборе оптимальной тактики лечения, для достижения максимальных вероятностей положительных исходов лечения.

Вторая же цель поиска, не менее ценная, чем первая, заключается в оценке уравнений связи между показателем, характеризующим период наблюдения, и набором ВСЕХ фиксируемых признаков. То есть оценивается модель описания динамики лечения. При этом для оценки подобной модели вполне разумно использовать иную структуру БД. Схема БД со структурой «сверху – вниз» приведена ниже.

Number

Period

VAR1

VAR2

VAR3

VAR4

VARi

1

1

 

 

 

 

 

 

2

1

 

 

 

 

 

 

3

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В такой БД конкретный столбец содержит один и тот же признак, только фиксируемый в разные периоды наблюдения. А признак Period содержит номера периодов наблюдения. В этом случае те признаки, которые значимо не изменяют структуру связей в разные периоды наблюдения, не войдут в уравнение логистической регрессии, отражающее динамику этой структуры. Тогда как показатели, имеющие значимые вклады в структуру связей в разные периоды наблюдения, войдут в конечное уравнение. И в этом случае будет ясно, какие подгруппы признаков следует изучать в динамике. Другой, не менее важный результат при изучении результатов моделирования будет заключаться в исследовании результатов переклассификации наблюдений за все периоды с помощью полученных уравнений логит-регрессии. Напомним, что одним из показателей качества получаемых уравнений логистической регрессии является результат переклассификации анализируемых наблюдений. Чем ближе процент правильной переклассификации (показатель конкордации) к 100%, тем выше качество полученного уравнения.

Например, анализируется взаимосвязь признака PERIOD  имеющего 4 градации (4 временных периода) и некоторого набора признаков. На основе полученного уравнения производится переклассификация проанализированных наблюдений. И в результате получается следующая таблица.

Фактические периоды

Период

1

2

3

4

Пред

1

96

4

0

0

сказан

2

1

50

46

3

ные

3

0

42

57

1

периоды

4

0

0

0

100

Внутри таблицы приведены проценты предсказанных частот наблюдений по каждому из 4-х периодов. Видно, что из наблюдений 1-го периода 96% переклассифицированы в 1-й период, и лишь 4% отклассифицированы во второй период. В 4-м периоде все 100% были переклассифицированы в этот же 4-й период. Тогда как классификации наблюдений из 2-го и 3-го периода дают «размытый» результат. Правильно выдаётся классификация примерно для половины случаев. А вторая половина наблюдений классифицируется в соседний 2-й или 3-й периоды. Из чего можно сделать вывод о том, что видимо набор признаков, содержащийся в анализируемой БД, не позволяет различать 2-й и 3-й периоды наблюдения.

Также вероятно, что в течение 2-го и 3-го периода не происходит значимых изменений структуры связей внутри анализируемого массива признаков. Хотя такой результат может быть связан и количеством наблюдений за 2-й и 3-й периоды. Ведь по самым различным причинам эти количества могут существенно отличаться от количества наблюдений за остальные периоды. Более точный ответ на этот вопрос требует для этого проведения дополнительных методов анализа. В том числе, например, с использованием разных алгоритмов оценки уравнений логит-регрессии, а также с использованием бутстреп-метода. Например, недавно мы проводили анализ с помощью логистической регрессии нескольких тысяч наблюдений, собранных в одном из федеральных кардиологических центров. И использование бутстреп-метода позволило существенно улучшить результат оценки уравнений логистической регрессии для бинарной зависимой переменной «Исход лечения» (нелетальный и летальный исход). Однако, одним из вариантов подобного результата может быть объединение 2-го и 3-го периодов.

Как уже говорилось выше, при анализе реальных данных приходится оценивать достаточно большое количество уравнений регрессии с различными наборами переменных. В этом случае задача исследователя заключается в выборе наиболее подходящих уравнений и их клиническое осмысление. Для этого проводится проверка каждого уравнения путем изменений значений предикторов, которые в принципе могут быть изменены с помощью различного рода воздействий. Тогда как другая часть факторов являются не управляемыми, например исходные данные пациента (пол, возраст, тяжесть травмы и т.д.), на них мы не можем повлиять. Однако в зависимости от комбинации таких неизменяемых признаков может оказаться, что влияние изменяемых показателей на вероятность того или иного исхода, может быть различна.
Оптимальный результат далеко не всегда находится на первом этапе проведения многомерных исследований. Конечно, для проведения столь сложного метода анализа требуется помощь опытного специалиста (биостатистика), но оценить полученные при этом результаты можно силами самого врача.

Например, для выяснения факторов риска развития послеоперационных осложнений было получено около 100 уравнений. Ниже приведены три из полученных уравнений.

Первое уравнение:

Процент конкордации уравнения равен 97,5%. В это уравнение вошли 4 предиктора. Два из них управляемые – это продолжительность операции и тактические ошибки. При этом наибольшие значения стандартизованные коэффициенты имеют у признаков VAR41A и VAR74A. Однако недостатком этого уравнения является наличие у признаков VAR41A и VAR44A пропущенных значений в большом количестве наблюдений. Кроме того, в этом уравнении отсутствуют признаки, определяющие исходное состояние пациента, но его можно использовать для оценки прогноза в динамике, например в 1 сутки послеоперационного периода.

Набор признаков включает диагностические критерии, полученные в 1 сутки послеоперационного периода и они могут как увеличивать риск развития осложнений, если достигают пороговых значений, так и снижать его, если не достигнут опасного уровня. Поэтому у пациентов с высоким риском развития послеоперационных осложнений, прогнозируемым по исходным данным, можно в динамике увидеть изменение прогноза развития неблагоприятного исхода операции в ту или иную сторону.

Второе уравнение имеет следующий вид:

В это уравнение вошли уже 6 предикторов. Из предыдущего уравнение повторяется признак VAR66. Управляемыми в этом уравнении кроме признака VAR66, являются также VAR65А, VAR68А, VAR77А и VAR81А. Наибольшее значение стандартизованного коэффициента у признака VAR77A. Это уравнение имеет большее значение для профилактики осложнений, так как имеет большее количество признаков, позволяющих изменить неблагоприятный прогноз.
Наконец третье уравнение:

В данное уравнение в качестве предикторов вошли уже 7 признаков, и свободный член отсутствует. Причем два признака повторяются в сравнении с предыдущим уравнением (VAR81А, VAR77А). Кроме них в уравнении имеется ещё один управляемый предиктор VAR76А. Наибольшие значения стандартизованных коэффициентов имеются у признаков VAR52AA и VAR77A. Как мы видим, признак VAR77А в обоих уравнениях имеет большое значение стандартизованного коэффициента.

Совместив три уравнения в одну таблицу (файл logist_1_2_3.xls ) можно сравнить прогноз по каждому наблюдению (пациенту). Тем самым уменьшив количество ложноположительных и ложноотрицательных результатов. Кроме того, это позволяет лучше понять, как влияет изменение отдельных предикторов на вероятности каждого исхода.

Клинический пример №18(181) без осложнений
Пострадавший Н, 26 лет. Проникающее ранение брюшной полости. Ранение печени, желудка и головки поджелудочной железы. Выполнена лапаротомия, ушивание ран печени и желудка и дренирование сальниковой сумки. Послеоперационный период протекал без особенностей. Специфических послеоперационных осложнений (СПО) не возникло.
Во всех трех уравнениях для этого наблюдения управляемые предикторы имеют значения, которые не являются факторами риска СПО. Тем самым прогноз по всем уравнениям на 99,9%, 70,7% и на 97,9% был в пользу не осложненного течения.
Изменяя значения предикторов, на которые можно повлиять, удается выявить наиболее значимые для клиники факторы риска осложнений (и пороговое значение для количественных признаков).

Так в уравнении №1 – повлиять можно на продолжительность операции (VAR66) и тактические ошибки во время операции (VAR74A).  При увеличении продолжительности операции до 380 минут  прогноз меняется и при такой продолжительности операции возможно развитие осложнений с вероятностью 60,4% (Р1=0,395, 1-Р1=0,604). Другими словами, если сложность клинического случая или недостаточный опыт хирурга приведут к тому, что продолжительность вмешательства затянется более 6 часов то, скорее всего это послужит причиной развития осложнений. Такая же ситуация возникает если во время операции допускается тактическая ошибка (значение переменной VAR74A = 2) Р1=0,17, 1-Р1=0,83.

В уравнении №3 такими факторами являются кроме продолжительности операции (VAR66), способ дренирования СС (VAR65А), наличие задержки операции (VAR68А), выполнение герметичного ушивание раны ПЖ (VAR77А) и медикаментозная профилактика травматического панкреатита (VAR81А). Если увеличить время операции, использовать неадекватное дренирование, ушивание раны или не проводить профилактику травматического панкреатита, каждый из этих факторов приведет к изменению прогноза, т.е. к развитию осложнения. Такая же картина получается и при анализе уравнения 3.


Клинический пример №187(180) с осложнениями
Пострадавшая Б, 58 лет. Торакоабдоминальное ранение слева. Ранение левого купола диафрагмы, сквозное ранение селезенки и хвоста поджелудочной железы. Выполнена лапаротомия, ушивание ран диафрагмы, спленэктомия, ушивание раны поджелудочной железы. С гемостатической целью к хвосту поджелудочной железы подведён тампон. На 5 сутки после операции диагностирован инфицированный некроз поджелудочной железы в области повреждения с формированием поддиафрагмального абсцесса слева. Выполнено вскрытие и дренирование абсцесса.

В отличие от предыдущего примера в этом наблюдении во всех уравнениях большинство предикторов имеют значения, характерные для возникновения осложнений (т.е. являются факторами риска). В этом примере, убирая влияние одного из фактора риска, можно узнать его вес в неблагоприятном прогнозе. У пациентки имеются весомые неизменяемые факторы риска СПО, по уравнениям 2 и 3. В связи с этим изменение даже всех управляемых предикторов не приводит к благоприятному прогнозу. Так если изменить качественные признаки (VAR65А, VAR68А, VAR77Аи VAR81А) на противоположные значения, а продолжительность операции (VAR66) уменьшить до 60 минут (что не реально для такого объёма повреждений), то только в этом случае прогноз по 5 уравнению изменится. А в 3-м уравнении изменение даже всех управляемых ФР не меняет прогноз.

Изменяя комбинации значений предикторов в файле logist_1_2_3.xls можно оценить, как при этом изменяются вероятности обоих исходов при использовании всех трёх уравнений. При этом несложно заметить, что чем больше размах средних величин ВЕТА (сумма модулей положительного и отрицательного среднего ВЕТА), тем ближе средние вероятности отнесения к двум исходам к нулю и к единице, и наоборот. Т.е. чем ближе будут модули двух средних ВЕТА к нулю, тем ближе обе вероятности будут к 50%.

Для лучшего осмысления технологии сравнения нескольких уравнений логит-регрессии между собой предлагаем читателям, скачав файл logist_1_2_3.xls, сделать различные модификации величин предикторов, наблюдая при этом мгновенные изменения величин. Отметим, что приведённые в этом файле средние значения параметра ВЕТА и вероятностей, вычислены для исходной комбинации значений предикторов.  Т.е. эти значения не будут изменяться при изменении значений предикторов.


Далее: 8. Логистическая регрессия - "вершина пирамиды". А в "фундаменте" - что?

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Уважаемые читатели! Благодаря усилиям зарубежных коллег, начиная с марта 2017 г. стоимость выполнения заказов по стат. анализу массивов данных сократилась, по сравнению с 2016 г., на 25-30%.

Отзывы заказчиков по статистическому анализу данных

Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками.


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.


23 примера оформления данных, их описания и описания целей исследования


В ноябре 2013 года сайту БИОМЕТРИКА исполнилось 16 лет. А что было раньше? И что теперь?


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.
М.И. Антоненко
 
ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ.

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.


В новый век - с доказательной биомедициной
Газета ПОИСК, № 20 (522)
21 мая 1999
г.


Долгое прощание
с
лысенковщиной 

История науки не ограничивается перечислением успешных исследований. Она должна сказать нам о безуспешных исследованиях и объяснить, почему некоторые из самых способных людей не могли найти ключа знания, и как репутация других дала лишь большую опору ошибкам, в которые они впали.

Дж. Максвелл 

Функциональный кризис отечественной науки, переживаемый в последнее десятилетие, вынуждает беспристрастно анализировать основные причины этого явления [1-2, 45-47]. Последние результаты библиометрического анализа говорят о том, что вклад России в мировую науку по основным направлениям составляет уже порядка 5-8% [1-2]. По данным того же источника вклад США составляет 32-41%. 

Коммунистическая идеология, уродовавшая многие направления отечественной науки на потребу вождей, породила и такое явление, как лысенковщина. Для большинства читателей фамилия Лысенко ассоциируется с августовской сессией ВАСХНИЛ 1948 г. и разгромом генетики. Однако лысенковщину нельзя сводить только к запрету на генетику. Достигнув своего апогея в середине текущего века, и став воистину периодом средневековья в отечественной биологии и медицине, лысенковщина изуродовала и методологию этих наук, изгнав из них в частности математику, и в первую очередь статистику. Последствия этого уродства и по сей день не позволяют биологии и медицине приблизиться к статусу точных наук. В статье описаны основные этапы этого явления и особенности методологии применения статистики в биологии и медицине, полученные автором при анализе нескольких сот диссертаций и монографий а также более 1500 статей в области экспериментальной биомедицины. 


Автор понимает, что поднятая им проблема достаточно обширна и не может быть полностью освещена в одной статье, содержащей лишь малую часть материалов готовящейся к изданию монографии, посвященной проблемам применения статистики в медицине и биологии. Автор будет признателен читателям, которые выскажут свой взгляд на эту проблему, а также смогут дополнить авторские материалы новыми примерами.  Обсуждаемая в данной статье проблема может быть решена только общими усилиями всех заинтересованных в этом специалистов.

Работая над этой статьей, мне довелось несколько раз встречаться с одним из ректоров медицинского вуза. Обсуждая с ним предлагаемые в статье меры, направленные на исправление этого неприглядного положения, я с изумлением услышал от него такой ответ: "Как ученый - я "За", а как ректор - "Против"! И если так мыслит и говорит ректор, доктор медицинских наук, член-корреспондент РАМН, то несложно понять отношение к этой проблеме рядовых сотрудников такого вуза. Не потому ли многие из них представлены в разделе КУНСТКАМЕРА, вместе с моим собеседником, своими диссертациями и статьями...

За те несколько лет, что прошли с момента публикации этой статьи, а также статей  "В новый век - с доказательной биомедициной"(ПОИСК, N 20 (522) 21 мая 1999) и "Куплю 500 диссертаций! (Медицинская Газета N10 за 14.02.2001)", практически ничего не изменилось. Да, в России стали писать и говорить о доказательной медицине, проводить конференции по этой тематике, а в некоторых медицинских вузах даже открыли центры доказательной медицины. Однако откроем биомедицинские журналы и диссертации, и станет ясно, что это не более чем дань моде... 

Материалы по науковедению

В новый век - с доказательной биомедициной


1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"