Яндекс.Метрика

Логистическая регрессия в медицине

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
". Д. Дидро

Статистика посещаемости БИОМЕТРИКИ Яндекс
цитирования
Индекс цитирования

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
Яндекс
цитирования
Яндекс цитирования
 

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят...


Введение
Наши возможности. О возможностях статистического анализа
Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35
Список научных и учебных изданий по биометрике и статистике
Материалы по науковедению
История биометрики
Статистическое рецензирование статей и диссертаций

Долгое прощание с лысенковщиной...
Семинар по биометрике в Красноярске



Если Вы сторонник использования
статистики, разместите на своём сайте
HTML-код нашего баннера:

BIOMETRICA - журнал для сторонников доказательной биологии и медицины
25 наиболее популярных ссылок, посещаемых нашими читателями
http://www.biometrica.tomsk.ru/comp_aver.htm
http://www.biometrica.tomsk.ru/erevan_8.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/UNESCO%202010.pdf
http://www.biometrica.tomsk.ru/zakaz.htm
http://www.biometrica.tomsk.ru/zakaz_28.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/STAT_CARDIO_2014.pdf
http://www.biometrica.tomsk.ru/logit_9.htm
http://www.biometrica.tomsk.ru/stat_cardio7.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/percent_00.htm
http://www.biometrica.tomsk.ru/lis.htm
http://www.biometrica.tomsk.ru/kamchat.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/zakaz_15.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

БИОМЕТРИКА + Музыка. В. Леонов.

Музыка... Вот что сказал о ней великий Иоганн Себастьян Бах: "Цель музыки - трогать сердца". В детстве автор этих строк получил музыкальное образование. Любимыми инструментами были мандолина и гитара. Любимыми композиторами - Вивальди, Бах, Альбиони, Боккерини, Беллини, Корелли, Скарлатти. В 80-е годы прошлого столетия в Томск часто приезжал с концертами маэстро Владимир Спиваков. Эти концерты организовывал Егор Лигачёв, бывший в ту пору первым секретарём Томского обкома КПСС. На свой первый концерт в Томск Владимир Спиваков приехал один. Великолепно играл на скрипке! Концертный зал был переполнен слушателями, которые были в восторге от его концерта. Именно тогда мне удалось впервые встретиться с ним, и взять у него автографы на его грампластинки. В дальнейшем посещал все его концерты. В 1979 г. В. Спиваков организовал камерный оркестр "Виртуозы Москвы". Однажды в 90-е годы Владимир Спиваков должен был приехать в Томск с "Виртуозами Москвы", и в течение трёх дней дать 3 концерта. Однако из-за проблем с топливом в те времена, их самолёт посадили в Омске, где они пробыли 2 дня. И когда прилетели в Томск, то в один день провели все 3 концерта, которые я прослушал. И вновь взял автографы на новые грампластинки, и сделал много фотографий В. Спивакова.


Музыка...  Она помогает всегда. Вот почему я рассылаю почти всем своим корреспондентам файлы с хорошей музыкой. Любите музыку, слушайте её чаще. И она поможет лучше понимать бистатистику и результаты статистического анализа...

13 февраля 2014 г. Владимир Спиваков и "Виртуозы Москвы" дали концерт в Краснодаре. Я посетил этот прекрасный концерт, и вновь встретился с Владимиром Теодоровичем. Подарил ему его грампластики, фотографии, и свою книгу.

Логистическая регрессия в медицине и биологии

В. Леонов

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5. Особенности логистической регрессии в акушерстве.
6. Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество уравнений логистической регрессии.


В данной серии статей, на уровне доступном для начинающих, рассмотрены основы логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Объяснено, что методу присуща множественность решений, что позволяет выбирать для использования в реальной врачебной практике наиболее удобные и надёжные тактики лечения. Рассмотрено использование метода к массивам данных, содержащим несколько сотен признаков. Показано, что корректное создание таких массивов и их анализ возможны лишь при участии биостатистиков на самых первых этапах таких исследований. Рассмотрена связь логистической регрессии и ROC-анализа. Приведены многочисленные уравнения логистической регрессии и ROC-кривые, полученные при анализе реальных данных. Объяснена целесообразность использования вместе с методом логистической регрессии набора методов анализа парных взаимосвязей между различными признаками, а также использование более сложных методов многомерной статистики.

Логистическая регрессия. Анализ массивов большой размерности.

Научное изучение всех явлений,
касающихся здорового и больного
человека, есть та база, на которой
основываются все достижения
клинической медицины,
как медицины научной.
____________
В.И. Глинчиков

 

Наиболее интересны, и в то же время наиболее сложны и трудоёмки, оценки уравнений логистической регрессии для массивов большой размерности, т.е. для данных, содержащих по несколько сотен переменных. С двумя примерами анализа таких объёмных матриц можно познакомиться в статьях «Логистическая регрессия в анализе связи артериальной гипертонии и психических расстройств». Н.П.Гарганеева, В.П.Леонов. Сибирский медицинский журнал, № 3-4, 2001, с.42-48.  (http://www.biometrica.tomsk.ru/lib/psycho3.htm ) и «Артериальная гипертония как психосоматическая проблема». Н.П. Гарганеева, Ф.Ф. Тетенев, В.Я. Семке, В.П. Леонов. Клиническая медицина, № 1, 2004, с. 35-41 (http://www.biometrica.tomsk.ru/lib/psycho2.htm ).

Рассмотрим несколько таких массивов и обсудим специфику работы с ними. Первый массив, созданный Евдокимовой Т.А. при изучении аллергии, содержит более 1200 наблюдений и более 400 признаков. Ниже приведён перечень этих признаков.

NUMBER="Номер наблюдения"

VAR1A="проблемы при употребл. молока"

VAR2A="избегаете употреб. молока из-за ПА"

VAR3A="Как часто употребляете молоко"

VAR4A="Проблемы при употреблении яиц"

VAR5A="Избегаете употреб. яиц из-за ПА?"

VAR6A="как часто едите яйца?"

VAR7A="Проблемы из-за рыбы?"

VAR8A="избегаете употребления рыбы?"

VAR9A="как часто едите рыбу?"

VAR10A="ПА на креветки?"

VAR11A="Избегаете употребления из-за ПА?"

VAR12A="как часто едите креветок?"

VAR13A="ПА на моллюсков?"

VAR14A="Избегаете их употребление?"

VAR15A="как часто едите моллюсков?"

VAR16A="ПА на арахис?"

VAR17A="избегаете употребление арахиса"

VAR18A="как часто едите арахис?"

VAR19A="ПА на фундук?"

VAR20A="Избегаете употребления фундука?"

VAR21A="Как часто едите фундук?"

VAR22A="ПА на грецкий орех?"

VAR23A="избегаете употребления?"

VAR24A="как часто едите грецкий орех?"

VAR25A="ПА на шоколад?"

VAR26A="избегаете употребления шоколада?"

VAR27A="Как часто едите шоколад?"

VAR28A="ПА на персики?"

VAR29A="Избегаете употреблять?"

VAR30A="Как часто едите?"

VAR31A="ПА на яблоки?"

VAR32A="избегаете употребления яблок"

VAR32A="Как часто едите яблоки?"

VAR34A="ПА на киви?"

VAR35A="Избегаете употреблять киви?"

VAR36A="Как часто едите?"

VAR37A="ПА на Бананы?"

VAR38A="Избегаете употребления бананов"

VAR39A="Как часто едите бананы?"

VAR40A="ПА на дыню?"

VAR41A="Избегаете употребления дыни?"

VAR42A="Как часто едите дыню?"

VAR43A="ПА на клубнику?"

VAR44A="Избегаете употребление клубники"

VAR45A="Как часто едите клубнику?"

VAR46A="ПА на апельсин?"

VAR47A="Избегаете употребления апельсина?"

VAR48A="Как часто едите апельсин?'

VAR49A="ПА на помидор?"

VAR50A="Избегаете употребления помидоров?"

VAR51A="Как часто едите помидоры?"

VAR52A="ПА на морковь?"

VAR53A="Избегаете употр.моркови?"

VAR54A="Как часто едите морковь?"

VAR55A="ПА на сою?"

VAR56A="Избегаете употребления сои?"

VAR57A="Как часто едите сою?"

VAR58A="ПА на пшеницу?"

VAR59A="Избегаете употреб.пшеницы?"

VAR60A="Как часто едите пшеницу?"

VAR61A="ПА на гречку?"

VAR62A="Избегаете употреб.гречки?"

VAR63A="Как часто едите гречку?"

VAR64A="ПА на кукурузу?"

VAR65A="Избегаете употр.кукурузы?"

VAR66A="Как часто едите кукурузу?"

VAR67A="ПА на рис?"

VAR68A="Избегаете употреб.риса?"

VAR69A="Как часто употреб.рис?"

VAR70A="ПА на горчицу?"

VAR71A="Избегаете употреб.горчицы?"

VAR72A="Как часто едите горчицу?"

VAR73A="ПА на подсолнечник?"

VAR74A="Избегаете употреб.подсолн?"

VAR75A="Как часто употреб.подсолн."

VAR76A="Реакции при употреблении др.пищ.прод."

VAR77A="продукт, код"

VAR78A="продукт, код"

VAR79A="продукт, код"

VAR80A="какой из прод.вызывал больше проблем?"

VAR81="Возр.появл.первых симпт.на этот продукт"

VAR82="Возр,появл.симпт на прод в послед. раз?"

VAR83A="Как часто была ПА после употребл.прод?"

VAR84A="Избег.есть прод.после возникн.симпт?"

VAR85A="Отмеч.при употр.прод.припухл.во рту?"

VAR86A="покраснение или зуд кожи?"

VAR87A="диаррея или рвота?"

VAR88A="насморк или заложенность носа?"

VAR89A="покраснен.раздраж.глаз или слезотеч."

VAR90A="затрудненным глотанием?"

VAR91A="одышкой?"

VAR92A="скованностью в суставах?"

VAR93A="обмороком или головлкружением?"

VAR94A="головной болью?"

VAR95A="Другие симптомы?"

VAR96A="симптомы"

VAR98="Ч-з какое вр.посл.еды появл.сим-мы,мин?"

VAR99="дни"

VAR100="как долго это продолжалось, минуты?"

VAR101="Часы?"

VAR102="Дни?"

VAR103A="Проводилось ли лечение?"

VAR104A="лекарство 1, код"

VAR105A="лекарство 2, код"

VAR106A="лекарство 3, код"

VAR107A="Говорил врач, что у ребенка ПА?"

VAR108A="Получ.реб.первые два года вит.Д?"

VAR109A="Пьет ли ребенок молоко?"

VAR110A="ест ребенок масло или маргарин?"

VAR111A="Отмеч.хрипы,свист в теч посл. 12 мес"

VAR112A="была ли одышка во время хрипов?"

VAR113A="Отмеч.хрипы,свист, когда реб.неболел"

VAR114A="была у ребенка астма?"

VAR115="Возр,когда отмеч.перв приступ астмы?"

VAR116A="был приступ астмы за посл.12 мес?"

VAR117A="ск-ко за посл.12 мес.просып от астмы?"

VAR118A="были ли у ребенка симптомы ринита?"

VAR119="Возр. появил.первых симп-в ринита?"

VAR120A="были сим-ы заложе.носа, в отсут.ОРЗ?"

VAR121A="Отмеч.сим-мы АР в теч.посл.12 мес?"

VAR122A="Сопровожд.ли симпт.АР раздраж.глаз?"

VAR123A="Была ли сыпь в течение 6 мес?"

VAR124="Ско-ко лет реб.,когда появилась сыпь?"

VAR125A="сыпь,локализ.в локтевых сгибах?"

VAR126A="сыпь локализ.под коленями?"

VAR127A="сыпь локализ.впереди лодыжек?"

VAR128A="сыпь локализ.вокруг шеи?"

VAR129A="сыпь локализ.вокруг ушей?"

VAR130A="сыпь локализ.вокруг глаз?"

VAR131A="была ли сыпь за последние 12 мес?"

VAR132A="была ли экзема?"

VAR133A="При контакте с живот.появл.кашель?"

VAR134A="при контакте с жив.появл.хрипы?"

VAR135A="при конт.с жив.чувств.тяж.в груди?"

VAR136A="при конт.с жив.затрудне.дыхания?"

VAR137A="при конт.с жив.чих.или залож.носа?"

VAR138A="при конт.с жив.-раздраж.глаз"

VAR139A="При конт.с пыльцой, появл.кашель?"

VAR140A="при конт.с пыльцой появл.Хрипы?"

VAR141A="при конт. с пыльц.-тяж.в груди?"

VAR142A="при конт.с пыльц.-затруднен.дых."

VAR143A="при конт.с пыльц.-чих.,залож.носа?"

VAR144A="при конт.с пыльц.-раздраж.глаз?"

VAR145A="получал ли ребенок СИТ?"

VAR146A="СИТ пыльцой?"

VAR147A="СИТ клещем домашней пыли?"

VAR148A="Была рвота несвяз.с отравл в теч.посл.6 мес?"

VAR149A="тошнота?"

VAR150A="жжение или боль в середине груди"

VAR151A="кислый вкус во рту"

VAR152A="принимал реб.антирефл.преп.в теч.посл.6 мес"

VAR153="Ско-ко лет матери, когда она родила реб"

VAR154="на каком сроке берем.рожден ребенок"

VAR155="рост при рождении"

VAR156="вес при рождении"

VAR157A="ск-ко раз в теч 2 лет реб переезжал"

VAR158A="мать употребл алког. во вр.берем."

VAR159A="Как часто мать принимала алкоголь"

VAR160A="кури ли мать во время беремен."

VAR161="сколько сигарет в день?"

VAR162A="Получал ребенок грудное вскармл?"

VAR163="кагда перестали кормить грудью,дни"

VAR164="отн.от груди, недели?"

VAR165="отн.от груди, месяцы?"

VAR166A="ребенок ел молоч.смеси?"

VAR167="когда впервые получил смесь,дни"

VAR168="получил смесь, недели?"

VAR169="получил смесь, месяцы?"

VAR170="Когда прекращено кормл.смесью,дни"

VAR171="прекращ.кормл., недели"

VAR172="прекращ.кормл., месяцы?"

VAR173A="Смесь на основе коровьего молока?"

VAR174A="смесь на основе соевого молока?"

VAR175A="гипоаллергенная смесь?"

VAR176="дополн.жидкость реб.дали в,нед"

VAR177="Когда ввели прикорм,недели"

VAR178A="была у реб.инф.дых.путей до 2 лет"

VAR179A="Госпитал.до 2 лет с забол.легких?"

VAR180A="получал антиб.в первые 2 года жизни"

VAR181="сколько братьев и систер?"

VAR182="сколько старших братьев и сестер?"

VAR183="сколько младших?"

VAR184="у скольких братьев-сестер была астма?"

VAR185="у скольких братьев-сестер были др. АЗ"

VAR186="ск-ко детей спали в детской первые 2 г."

VAR187A="старшие дети спали с этим ребенком?"

VAR188A="ходил в д.с.со старшими дет.до 2 лет"

VAR189="когда пошел в садик?"

VAR190A="где чаще всего жил ребенок до 2 лет"

VAR191A="дома была кошка в первые 2 г.ж."

VAR192A="дома была Собака в первые 2 г.ж."

VAR193A="дома были Лошади в перв.2 г.ж.?"

VAR194A="дома были птицы в перв. 2 г.ж.?"

VAR195A="морские св.и др.пушис.животные?"

VAR196A="другие"

VAR197A="В настоящее время в доме есть кошка?"

VAR198A="в доме есть Собака?"

VAR199A="в доме есть лошади?"

VAR200A="в доме есть птицы?"

VAR201A="в доме есть кролики?"

VAR202A="в доме есть мыши?"

VAR203A="в доме есть морск.свин.и др.?"

VAR204A="другие?"

VAR205A="как часто реб.присут.при приготовл.пищи"

VAR206A="была у матери когда-нибудь ПА?"

VAR207A="Была у матери астма?"

VAR208A="Экзема или кожная аллергия?"

VAR209A="был у матери Ал.ринит?"

VAR210A="какой у матери образов, Неполн.ср."

VAR211A="у матери ср.образов?"

VAR212A="у матери высш. образов."

VAR213A="мать работает в настоящее время?"

VAR214A="мать связана с пищ.прод?"

VAR215A="мать работала в латексных перч.?"

VAR216A="Перчатки были напудрены тальком?"

VAR217A="Мать курила после рождения реб."

VAR218A="мать курила, когда был рожден реб."

VAR219="Число сигарет в день"

VAR220="Ск-ко лет реб. когда мать снова закур?"

VAR221="Сколько сигарет в день?"

VAR222="Как много мать курит сейчас? В день"

VAR223A="Бросила курить?"

VAR224="Ск-ко лет реб, когда мать бросила курить?"

VAR225="Ск-ко чел. курили в доме в первые 2 г.ж.?"

VAR226="ск-ко час реб. наход. в накур.помещ.-2г.ж."

VAR227="Ск-ко чел. регул. курят сейчас?"

VAR228="Ск-ко час в день реб.нах-ся в накур.пом?"

VAR229A="Была ли у отца ПА?"

VAR230A="была у отца астма?"

VAR231A="была у отца экзема или дерматит?"

VAR232A="Был у отца  ал. ринит?"

VAR233A="какое образов. у отца? Неполное ср."

VAR234A="полное среднее?"

VAR235A="высшее образование?"

VAR236A="Отец работает в настоящее время?"

VAR237A="Была у него раб. связан. с перера.прод.пит?"

VAR238A="работал отец в латексных перчатках?"

VAR239A="перчатки пудрили тальком?"

VAR240A="отец курил после рождения ребенка?"

VAR241A="Отец курил, когда ребенок был рожден?"

VAR242="сколько сигарет в день?"

VAR243="ск-ко лет реб., когда отец снова закурил?"

VAR244="число сигарет в день?"

VAR245="ск-ко отец курит сейчас,Сигарет в день?"

VAR246A="Бросил курить?"

VAR247="ск-ко лет было реб. когда отец бросил кур."

VAR248="вес"

VAR249="рост"

VAR250="Ср.диам.кжн.проб береза"

VAR251="Ср.диам.кжн.проб горчица"

VAR252="Ср.диам.кжн.проб молоко"

VAR253="Ср.диам.кжн.проб яйцо"

VAR254="Ср.диам.кжн.проб соя"

VAR255="Ср.диам.кжн.проб рыба"

VAR256="Ср.диам.кжн.проб лесн.орех"

VAR257="Ср.диам.кжн.проб дыня"

VAR258="Ср.диам.кжн.проб пшеница"

VAR259="Ср.диам.кжн.проб томат"

VAR260="Ср.диам.кжн.проб финики"

VAR261="Ср.диам.кжн.проб гистамин"

VAR262="Ср.диам.кжн.проб контроль"

VAR263="Ср.диам.кжн.проб арахис"

VAR264="Ср.диам.кжн.проб марь"

VAR265="Ср.диам.кжн.проб амброзия"

VAR266="Ср.диам.кжн.проб подсолнух"

VAR267="Ср.диам.кжн.проб сев.яблоко"

VAR268="Ср.диам.кжн.проб морковь"

VAR269="Ср.диам.кжн.проб яблоко юж."

VAR270A="ПА выявл.на скрин.или клинич.иссл.?"

VAR271A="после серолог.иссл.выявлена ПА"

VAR272A="ПА на яйца в анамнезе"

VAR273=" IG E яйцо, значение"

VAR274A="ПА на молоко в анамнезе"

VAR275="IG E молоко, значение"

VAR276A="ПА на рыбу"

VAR277="IG E к рыбе"

VAR278A="ПА на креветки в анамнезе"

VAR279="IG E на креветки"

VAR280A="ПА на арахис в анамнезе"

VAR281="IG E к арахису"

VAR282A="ПА на фундук в анамнезе"

VAR283="IG E к фундуку"

VAR284A="ПА на яблоки в анамнезе"

VAR285="IG E к яблоку"

VAR286A="ПА на персик в анамнезе"

VAR287="IG E к персику"

VAR288A="ПА на сельдерей в анамнезе"

VAR289="IG E к сельдерею"

VAR290A="ПА на киви в анамнезе"

VAR291="IG E к киви"

VAR292A="ПА на горчицу в анамнезе"

VAR293="IG E  горчице"

VAR294A="ПА на кунжут в анамнезе"

VAR295="IG E к кунжуту"

VAR296A="Па на сою в анамнезе"

VAR297="IG E к сое "

VAR298A="ПА на грецкий орех"

VAR299="IG E к грецк.ореху"

VAR300A="ПА на пшеницу"

VAR301="IG E к пшенице"

VAR302A="Па на гречневую крупу"

VAR303="IG E к гречке"

VAR304A="ПА на морковь в анмнезе"

VAR305="IG E к моркови"

VAR306A="ПА на томаты в анамнезе"

VAR307="IG E к томатам"

VAR308A="ПА на бананы в анамнезе"

VAR309="IG E к бананам"

VAR310A="ПА к чечевице в анамнезе"

VAR311="IG E к чечевице"

VAR312A="ПА на подсолн. в анамнезе"

VAR313="IG E к подсолн."

VAR314A="ПА на дыню в анамнезе"

VAR315="IG E к дыне"

VAR316A="ПА на зерно в анамнезе"

VAR317="IG E к зерну"

VAR318A="ПА на мак в анамнезе"

VAR319="IG E к маку"

VAR320="IgE к травам"

VAR321="IgE к березе"

VAR322="Общий IG E"

VAR323="Ig E к крапиве"

VAR324="Ig E к полыни"

VAR325="Ig E к рису"

VAR326A="пол.серолог.на к-л приор.прод"

VAR327A="Пол.серолог.на к-л приор.прод.1 гр"

VAR328A="пол.сер.на прод.1гр,искл.мол.и яйцо"

VAR329A="пол.на пищпродукты гр.2"

VAR330A="пол.серолог.на пищпродукты гр.3"

VAR331A="к любому пищпрод.исключ.мол.и яйца"

VAR332A="позитивная серология на яйца"

VAR333A="позитивная серология на молоко"

VAR334A="позитивная серология на рыбу"

VAR335A="позитивная серология на креветки"

VAR336A="позитивная серология на арахис"

VAR337A="позитивная серология на фундук"

VAR338A="позитивная серология на яблоко"

VAR339A="позитивная серология на персик"

VAR340A="позитивная серология на сельдерей"

VAR341A="позитивная серология на киви"

VAR342A="позитивная серология на горчицу"

VAR343A="позитивная серология на кунжут"

VAR344A="позитивная серология на сою"

VAR345A="позитивная серология на грецк.орех"

VAR346A="позитивная серология на пшеницу"

VAR347A="позитивная серология на гречку"

VAR348A="позитивная серология на морковь"

VAR349A="позитивная серология на томат"

VAR350A="позитивная серология на банан"

VAR351A="позитивная серология на чечевицу"

VAR352A="позитивная серология на подсолн."

VAR353A="позитивная серология на дыню"

VAR354A="позитивная серология на зерно"

VAR355A="позитивная серология на мак"

VAR356A="позитивная серология на рис"

VAR357A="ПА на любые не уточнен.орехи"

VAR358A="ПА на к-л приор.прод. 1гр в анамнезе"

VAR359A="Полож.анамн.на прод. 1гр,кр.мол.и яйца"

VAR360A="ПА в анамнезе на приор.прод. 2 гр"

VAR361A="ПА в анамнезе на приор.прод. 3 гр"

VAR362A="ПА в анамн.на несколько приорпрод."

VAR363A="несколько прод.исключая молоко и яйцо"

VAR364A="пол.анамн.и пол.серол.к приорпрод"

VAR365A="место жительства ребенка"

VAR366="стр.белки подсол.Hel a 2 S alb"

VAR367="стр.белок подсолн. Hel a 3"

VAR368="стр.белки Латекс Hev b 8_cal"

VAR369="стр.белок Гр.орех Jug r 2"

VAR370="стр.белок гр.ореха Jug r 4"

VAR371="стр.белок Томат Lyc e 3"

VAR372="стр.белок Яблоко Mal d 1"

VAR373="стр.белок яблока Mal d 2"

VAR374="стр.белок яблока Mal d 3"

VAR375="стр.белок яблока Mal d 4 "

VAR376="стр.белок Креветка Pen a 1"

VAR377="стр.белок Тимофе. Phl p 5"

VAR378="стр.белок тимоф Phl p 6"

VAR379="стр.белок тимоф Phl p 7"

VAR380="стр.белок Киви Act d 1"

VAR381="стр.белок Ананас Ana c 2"

VAR382="стр.белок Молоко Bos d 4"

VAR383="стр.белок молоко Bos d 4_cal"

VAR384="стр.белок молоко Bos d 5"

VAR385="стр.белок молоко Bos d 8"

VAR386="стр.белок молоко Caphcasein"

VAR387="стр.белок Фундук Cor a 1.04.01"

VAR388="стр.белок фундук Cor a 11"

VAR389="стр.белок фундук Cor a 2"

VAR390="стр.белок фундук Cor a 8"

VAR391="стр.белок фундук Cor a 9"

VAR392="стр.белок Карп Cyp c 1"

VAR393="стр.белок Морковь Dau c 4"

VAR394="стр.белок морковь Dau c 1.02.01"

VAR395="стр.белок морковь Dau c 1.01.03"

VAR396="стр.белок Персик Pru p 1"

VAR397="стр.белок персик Pru p 3"

VAR398="стр.белок Кунжут Ses i 1"

VAR399="стр.белок кунжут Ses i 2"

VAR400="стр.белок кунжут Ses i 3"

VAR401="стр.белок Горчица Sin a 1"

VAR402="стр.белок Пшеница Tri a 12"

VAR403="стр.белок пшеница Tri a 19.01.01"

VAR404="стр.белок пшеница Tri a gliadin"

VAR405="стр.белок пшеница Треска Gad m 1"

VAR406="стр.белок Яйцо Gal d 1"

VAR407="стр.белок яйцо Gal d 1_cal"

VAR408="стр.белок яйца Gal d 2"

VAR409="стр.белок яйца Gal d 2_cal"

VAR410="стр.белок яйца Gal d 3"

VAR411="стр.белок яйца Gal d 3_cal"

VAR412="стр.белок яйца Gal d 4"

VAR413="стр.белок яйца Gal d 5"

VAR414="стр.белок Соя Gly m 4"

VAR415="стр.белок соя Gly m 6"

VAR416="стр.белок соя Gly m 5"

VAR417="стр.белок Сельдерей Api g 1.01"

VAR418="стр.белок сельдерей Api g 1_cal"

VAR419="стр.белок сельдерей Api g 4"

VAR420="стр.белок сельдерей Api g 5"

VAR421="стр.белок арахиса Ara h 1_heat"

VAR422="стр.белок арахиса Ara h 1_nat"

VAR423="стр.белок арахиса Ara h 1"

VAR424="стр.белок арахиса Ara h 2.6"

VAR425="стр.белок арахиса Ara h 2.6_heat"

VAR426="стр.белок арахиса Ara h 3.4"

VAR427="стр.белок арахиса Ara h 8"

VAR428="стр.белок береза Bet v 1"

VAR429="стр.белок береза Bet v 2_cal"

VAR430A="ПОЛ респонд"

VAR431A="коды места жительства респонд"

 

Как видим, примерно половина признаков являются качественными, другая половина – количественными. Тактика анализа таких массивов данных определяется целями исследования и тем, каким образом предполагаются использовать полученные в исследовании результаты. Обычно такие полноценные массивы данных бывают «долгоиграющими», т.е. используемыми не только для разового анализа с целью защиты докторской или кандидатской диссертации, а подвергаются статистическому анализу многократно в течение нескольких лет с помощью различных методов. Это вызывается тем, что по мере получения результатов анализа таких массивов, возникает желание проверить новые гипотезы изучаемых механизмов развития и течения того или иного заболевания, уточнить ряд деталей, которые первоначально казались несущественными, разработать несложный алгоритм практического использования полученной модели и т.д. И это абсолютно верная и правильная тактика работы с подобными массивами. Поскольку такие массивы данных содержат огромные объёмы информации, которые извлекаются из них путём последовательного применения различных методов анализа. Типичным примером такого исследования является всемирно известное Фремингемское исследование - Framingham Heart Study.

Обычно программы работы по анализу подобных массивов данных включают порядка 50-100 пунктов. Предварительный анализ описанного выше массива по аллергии позволил получить для зависимых признаков VAR1A="проблемы при употребл. молока" и VAR4A="Проблемы при употреблении яиц" порядка десятка уравнений, с величиной показателя конкордации в интервале 85-95%.

Как уже говорилось выше, принципиальное отличие многомерных методов от других методов анализа заключается в использовании информации о взаимных связях анализируемых признаков. Предположим, что из представленных выше признаков наибольший интерес представляют 200 количественных признаков, и 210 дискретных, качественных признаков.  Из них 10 качественных признаков будем считать выходными, для которых необходимо оценить уравнения логистической регрессии. Для упрощения обозначим дискретные, качественные признаки буквой D, и далее номер по порядку, например, D1, D2, …, D200. Количественные же признаки обозначим аналогичным образом через К1, К2, …, К200. А зависимые качественные признаки обозначим как Z1, Z2, …, Z10.

В этом случае для каждого зависимого признака Zj можно использовать в качестве потенциальных предикторов самые разные наборы исходных переменных. Например, только 200 качественных переменных. Или же только 200 количественных признаков. Или все качественные и все количественные признаки. Однако в любом случае для понимания и интерпретации, получаемых при этом уравнений, необходимо изучить все парные взаимосвязи. Причём такое изучение не должно ограничиваться только анализом тех пар, в которых в качестве одного члена такой пары обязательно присутствует зависимый признак. Поскольку включение предикторов в уравнение базируется не только на использовании значимых связей между зависимой переменной и одной качественной или количественной, но и на использовании парных связей между отдельными качественными и отдельными количественными предикторами.

Применительно к нашему случаю это означает, что не следует ограничиваться только анализом связи между 200 парами качественных признаков вида Z1 – D1, Z1 – D2, …, Z1 – D200, или вида  Z1 – K1, Z1 – K2, …, Z1 – K200. Но необходимо также исследовать все парные связи вида DiDj,  KiKj, KiDj. Оценим для данного набора количество подобных парных связей, которые необходимо проанализировать. Начнём с дискретных качественных признаков. Для 200 качественных признаков число анализируемых пар составит 200*(200-1)/2=100*199=19900. Такое же число парных связей будет и для количественных показателей. Сюда же следует для каждой зависимой переменной Zi добавить ещё 400 парных связей вида ZiDj и ZiKj.

Отметим, что такой анализ, помимо его важности для интерпретации логистических моделей, имеет ещё и собственную колоссальную важность, поскольку он даёт огромное количество ценной информации о наличии или отсутствии взаимосвязей внутри многих пар признаков. Эта информация позволят более полно и осмысленно представить всю картину изучаемого явления. Для иллюстрации описанных выше оценок рассмотрим пример, в котором использованы всего лишь 7 потенциальных предикторов и одна зависимая переменная. Предположим, что исходя из результатов ранее выполненных исследований, модель изучаемого процесса может быть представлена в виде одной зависимой переменной Z, а также двух уровней потенциальных предикторов. В первом уровне имеется 4 предиктора (2 количественных – К1 и К2, и 2 дискретных – D1 и D2). Во втором уровне имеется 3 потенциальных предиктора (2 количественных – К3 и К4, и 1 дискретный – D3).

Рис. 2 Схема парных связей между предикторами и зависимой переменной

 

На рис. 2 стрелками представлены возможные парные связи между этими признаками. Число парных связей внутри 1-го уровня равно [4*(4-1)/2]=6. Число парных связей внутри 2-го уровня равно [3*(3-1)/2]=3. Число парных связей между 1 и 2 уровнями равно 4*3=12. И число парных связей между зависимой переменной Z и предикторами 1 и 2 уровней равно соответственно 4 и 3. Итого мы имеем 28 парных связей. Эту же самую оценку можно получить и иным способом: 8*(8-1)/2= 28, (где 8 – общее число анализируемых признаков). Несложно аналогичным образом подсчитать число тройных связей, в каждой из которых обязательно должен присутствовать зависимый признак Z.

Почему необходим анализ всех этих парных связей? Современные алгоритмы оценки уравнения логистической регрессии используют наиболее продуктивные пошаговые процедуры. При этом на каждом шаге такой процедуры может включаться один предиктор. Включение такого предиктора не обязательно может быть обусловлено наличием связи между зависимой переменной Z с этим предиктором, а наличием значимых связей между предикторами уже включёнными в уравнение, и предикторами-кандидатами на включение. Тщательный анализ шагов позволяет оптимизировать состав предикторов, добиваясь этим повышения качества модели, в частности, путём максимизации такого показателя, как процент конкордации.

При создании таких серьёзных массивов данных обязательно необходимо участие в их разработке профессиональных биостатистиков, причём уже на самых первых этапах формирования признакового пространства, а также формирования числа градаций качественных признаков. В качестве примера игнорирования этого требования приведу фрагменты недавней переписки.

31 мая 2011 г. я получил письмо следующего содержания.

«Уважаемый Василий Петрович!

Я пишу Вам по совету профессора А.М. Чернявского из НИИ Патологии Кровообращения имени Е.Н. Мешалкина г. Новосибирск. В нашем институте три недели назад официально начато Российское рандомизированное многоцентровое клиническое исследование влияния различных методов хирургической коррекции ишемической митральной недостаточности в сочетании с коронарным шунтированием на течение сердечной недостаточности и состоятельности коррекции митрального клапана. Это исследование официально зарегистрировано  на сайте www.clinicaltrials.gov, как "ХИРУРГИЧЕСКОЕ ЛЕЧЕНИЕ ИШЕМИЧЕСКОЙ МИТРАЛЬНОЙ НЕДОСТАТОЧНОСТИ" (Surgical Treatment of Ischemic Mitral rEgurgitation – “TIME”). Это большое исследование, рассчитанное на три года, в которое уже на начальном этапе согласились войти и начали работать по общему протоколу кардиохирургические центры  Екатеринбурга, Иркутска, Красноярска, Кишинёва, Москвы, Перми. Создана база больных, в которую вносятся данные из всех центров. В базе более 900 (!) переменных. В дальнейшем мы планируем обратиться к Вам для профессионального статистического анализа полученных данных. Но сейчас, пока работа по набору материала только началась, мы просим Вас, как большого профессионала в данной области, дать некоторые советы по возможному изменению базы данных и количества пациентов, которые будут принимать участие в данном исследовании.  В прикреплённых файлах Вы найдёте протокол исследования и базу данных. Заранее благодарен, если Вы найдёте время помочь нам!

С уважением, Рузматов Тимур»

Вместе с приведённым выше письмом автор прислал документ из 8 страниц, озаглавленный как «Протокол российского клинического многоцентрового исследования». В разделе 1.5 этого документа, сообщалось следующее. «Четыреста двадцать (420) пациентов мужского и женского пола в возрасте от 30 до 75 лет с клиническим диагнозом … , которым планируется  … , будут включены в исследование и получат … лечение». Внимательное изучение этого документа не привело к обнаружению хоть каких-то намёков на то, какие же конкретно гипотезы и какими статистическими методами организаторы этого исследования планируют проверять. А ведь именно для этого в медицинской науке и создаются подобные базы данных.

Из переписки с Т. Рузматовым выяснилось, что при организации данного исследования и формировании базы данных биостатистик не привлекался. Более того, при организации этого масштабного, и без сомнения необходимого многоцентрового исследования, руководители исследования вообще не запланировали этап статистического анализа этой базы данных и, соответственно, его финансирование. Такое отношение организаторов исследования к создаваемой базе данных не может не удручать. Фактически это означает, что затратив миллионы рублей на создание этой базы данных, из неё будет извлечена лишь самая примитивная информация. Причём ещё неизвестно, насколько корректно это будет сделано. Можно сказать, что такое формирование подобных баз данных есть наглядная иллюстрация подхода «Давай, Давай, – Потом Подумаем» и неуважения к биостатистике и к тем, кто занимается этой наукой
(см. наши статьи «Общие проблемы применения статистики в биомедицине или что разумнее: ДДПП или ДППД?» URL:http://www.biometrica.tomsk.ru/problem.htm и
«Искушение Знанием или  Сколько стоит биометрика?»
URL:http://www.biometrica.tomsk.ru/price_biom.htm).

Обстоятельства сложились так, что в начале 2011 г. автор этих срок некоторое время находился в этом самом НИИ. Будучи там я предложил зам. директора НИИ по науке профессору А.М. Ч. прочитать для сотрудников этого НИИ лекцию о современных возможностях биостатистики и типичных ошибках её использования в медицинской науке. Увы, оказалось, что лекция не нужна. Как не нужно и предложенное статистическое рецензирование статей в издаваемом в этом НИИ журнале. И это при том, что в этих статьях, и в диссертациях, защищаемых сотрудниками этого НИИ, те же самые ошибки, что и в кузбасских публикациях (http://www.biometrica.tomsk.ru/kuzbass1.htm ). О чём говорит такое отношение руководителей медицинской науки к биостатистике? Как минимум, об отсутствии у них знаний об эффективности современных методов биостатистики. И, соответственно, неэффективности создания подобных баз данных и их дальнейшего анализа без участия биостатистиков. В результате наша переписка с Т. Рузматовым закончилась тем, что я порекомендовал убедить руководителя этого исследования привлекать профессиональных биостатистиков ещё на этапе планирования подобных исследований, и увеличить объём базы данных в несколько раз. Ответа на эти предложения я не получил…

Для демонстрации неэффективности работы с базами данных, в которых количество признаков превышает объём наблюдений, рассмотрим следующий пример, построенный на реальной базе данных, подобной той, которую планируют создать организаторы упомянутого выше исследования.  

Ниже приведены признаки проанализированной базы данных, созданной исследователем Н.С. из Якутска при исследовании проблем в области акушерства.

NUMBER=«Номер наблюдения»

GRUPPA =«Группа: опытная и контроль»

VAR1 =«Возраст матери»

VAR2A =«Возраст матери группированный

VAR3 =«Возраст отца»

VAR4A =«Возраст отца группированный» 

VAR5A =«Исход»

VAR6 =«Койко-дней»

VAR7A =«Национальность»

VAR8 =«Беременность по счету»

VAR9A =«Течение первой половины беременности»

VAR10A =«Течение второй половины беременности»

VAR11A =«Анемия во время беременности»

VAR12A =«Хронический пиелонефрит»

VAR13A =«Ожирение»

VAR14 =«Роды»

VAR15A =«Течение родов»

VAR16A =«Исп-ние анальгезии и анестезии в родах»

VAR17A =«Медицинский аборт»

VAR18A =«Самопроизвольный выкидыш»

VAR19A =«Группа крови матери»

VAR20A =«Резус-фактор матери»

VAR21 =«Масса при рождении»

VAR22A =«Масса при рождении группированная»

VAR23 =«Рост»

VAR24 =«Срок родоразрешения» (недель)

VAR25A =«Предлежание»

VAR26A =«Пол»

VAR27A =«Состояние при рождении»

VAR28 =«Апгар на 1 мин»

VAR29 =«Апгар на 5 мин»

VAR30A =«Вскармливание»

VAR31 =«Убыль массы (%)»

VAR32A =«Состояние в отделении»

VAR33 =«Общий анализ крови Le»

VAR34 =«Общий анализ крови Er»

VAR35 =«Общий анализ крови Ht»

VAR36 =«Сахар крови, минимальное значение»

VAR37A =«Продолжительность гипогликемии (сут)»

VAR38A =«Время появления гипогликемии (сут.)»

VAR39A =«Метод коррекции гипогликемии»

VAR40A =«Тяжесть гипогликемии»

VAR41A =«Адекватность коррекции»

VAR42A =«Наличие симптоматики гипогликемии»

VAR43 =«Профиль угнетение-возбуждение»

VAR44A =«Изменение нейросонографии 12 градаций»

VAR45A =«Изменение нейросонографии 4 градации»

VAR46 =«Общий белок»

VAR47 =«Общий билирубин»

VAR48A =«Аллергологический статус»

VAR49A =«Соматический статус»

VAR50A =«Тяжесть неврологических проявлений»

VAR51A =«Неврологический статус – катамнез»

VAR52 =«Возраст постановки диагноза»

VAR53 =«Общая сфера»

VAR54 =«Общая сфера округлённая»

VAR55 =«Ориентир в месте времени и личных данных»

VAR56 =«Критичность»

VAR57 =«Адекватность поведения»

VAR58 =«Внимание»

VAR59 =«Корректурная проба»

VAR60 =«Наложенные и перечеркнутые предметы»

VAR61 =«Нахождение отличий между картинками»

VAR62 =«Исследование движений и действий»

VAR63 =«Мелкая моторика»

VAR64 =«Оральный праксис»

VAR65 =«Координация»

VAR66 =«Копирование»

VAR67 =«Гнозис»

VAR69 =«Акустический гнозис»

VAR70 =«Ориентирование простых фигур»

VAR71 =«Идентификация эмоций»

VAR72 =«Речь»

VAR73 =«Спонтанная речь»

VAR74 =«Проба на называние»

VAR75 =«Проба на понимание»

VAR76 =«Память»

VAR77 =«Слухоречевая память»

VAR78 =«Двигательная память»

VAR79 =«Зрительная память»

VAR80 =«Запоминание рассказа»

VAR81 =«Мышление»

VAR82 =«Понимание смысла рассказа»

VAR83 =«Выведение аналогий»

VAR84 =«Исключение понятий»

VAR85 =«Логическая задача»

VAR86 =«Воображение»

VAR87 =«Тест с геометрическими фигурами»

VAR88 = "Закончи рисунок"

VAR89 =«Такого не бывает»

VAR90 =«Общая оценка»

VAR91A =«Нейропсихологическое заключение»

VAR92A =«Посещение детского сада»

VAR93A =«Занятия с психологом»

VAR94A =«Занятия с логопедом»

VAR95 =«Возраст тестирования»

VAR96A =«Соотв-ие реч развития эпикризному сроку»

VAR97A =«Простая дислалия»

VAR98A =«Сложная дислалия»

VAR99A =«Стертая дизартрия»

VAR100A =«Заикание»

VAR101A =«Задержка речевого развития»

VAR102A =«Алалический синдром со стертой дизартрией»

VAR103A =«Нал-е указ-я в диагне на гипогликемию»

В качестве зависимого признака выступает переменная VAR15A =«Течение родов», имеющая три  градации:  1 - самопроизвольные,  2 - программированные,  3 – оперативные. Из исходного массива данных путём случайного отбора (равномерный закон распределения) отбиралось 10 подмассивов, объёмы которых были в 2 раза меньше, чем количество переменных. После чего по этим подмассивам оценивались 10 уравнений логистической регрессии. Сравнение 10 полученных уравнений показало различие их структуры. В частности, наблюдалось отличие уравнений  по составу предикторов. Помимо этого, в тех уравнениях, в которых были одинаковые предикторы, в большинстве случаев различались знаки коэффициентов для одних и тех же предикторов. В то же время для всех уравнений значения показателя конкордации были весьма велики, от 95 до 99%.

   Далее производилась следующая процедура. В каждый подмассив данных после оценки уравнений, добавлялось по 5 наблюдений, случайно выбранных из основного массива,  затем по этому дополненному массиву вновь производилась оценка уравнения. Далее из такого  дополненного массива удалялись 5 случайно выбранных наблюдений. В результате объём подмассива вновь возвращался к исходному. И вновь производилась оценка уравнений логистической регрессии.

Что же показали эти эксперименты? Они показали, что оценки уравнений, полученных по массивам столь малых объёмов, весьма неустойчивы. Т.е. в уравнениях, получаемых после добавления и удаления 5 наблюдений, не обнаруживается воспроизводимости состава набора предикторов. Применяя полученные таким образом уравнения для прогноза, используя для этой цели наблюдения, не входившие в подмассив по которому оценивали параметры уравнения, были получены показатели конкордации равные примерно 33%, а не 95-99%. Т.е. фактически наблюдалось равномерное случайное распределение этих наблюдений в три подгруппы зависимой переменной.  

            Все эти результаты говорят о том, что число наблюдений, число анализируемых переменных и число градаций дискретных признаков должны определяться заранее ещё на этапе разработки программы подобных исследований. Для чего и требуется участие в этом процессе профессионального биостатистика.  

            Следующий массив, созданный кардиологом О.П., включает более 300 признаков.

VAR1=«Дата рождения»

VAR2=«Дата госпитализации»

VAR3=«Дата выписки»

VAR4A=«Смерть в период настоящей госпитализации»

VAR5A=«Образование»

VAR6A=«Характер труда»

VAR7=«Возраст»

VAR8A=«Пол»

VAR9=«Рост»

VAR10=«Вес»

VAR11=«ИМТ»

VAR12=«ЛПИ»

VAR13=«ОТ»

VAR14=«ОБ»

VAR15A=«Инфаркт миокарда в прошлом»

VAR16A=«Стенокардия в анамнезе»

VAR17A=«ХСН в анамнезе»

VAR18A=«Инсульт/ТИА в анамнезе»

VAR19A=«Заболевания  периферических артерий»

VAR20A=«Хроническая почечная недостаточность»

VAR21A=«Чрезкожные коронарные вмешательства»

VAR22A=«Коронарное шунтирование»

VAR23A=«Коронарные стенозы > 50%»

VAR24A=«Мерц. аритмия»

VAR25A=«Курение»

VAR26A=«Сахарный диабет»

VAR27A=«Впервые выявленный СД»

VAR28A=«НТГ»

VAR29A=«Артериальная гипертензия»

VAR30A=«Гипер-холестеринемия»

VAR31А=«Семейный анамнез ИБС»

VAR32=«Сист.АД»при поступлении

VAR33=«Диаст.АД»при поступл

VAR34=«ЧСС»при поступл

VAR35A=«одышка на день исслед»

VAR36A=«Класс Killip»

VAR37A=«РИТМ ЭКГ»

VAR38A=«Блокады»

VAR39A=«ЖТ/ФЖ»

VAR40A=«ST»

VAR41A=«Основн. локализац. изм-ний на ЭКГ»

VAR42A=«глубина ИМ»

VAR43A=«Блокада ЛНПГ»

VAR44A=«Тип стресс-теста»

VAR45A=«Результат стресс теста»

VAR46А=«ТФН»

VAR47=«левая ВСА» 

VAR48=«правая ВСА»

VAR49=«левая ОСА»  

VAR50=«правая ОСА»

VAR51=«левая ПА»

VAR52=«правая ПА»

VAR53=«Толщина КИМ»

VAR54А=«Градация КИМ»

VAR55=«Креатинин (при поступлении)»

VAR56=«Глюкоза (при поступлении)»

VAR57=«Глюкоза натощак»

VAR58=«Общий холестерин»       

VAR59=«ЛПНП»

VAR60=«ЛПВП»

VAR61=«Триглицериды»

VAR62=«Лейкоциты (при поступлении)»

VAR63=«минимальное значение лейкоцитов»

VAR64=«Гемоглобин (при поступлении)»

VAR65=«Гематокрит (при поступлении)»

VAR66=«Эритроциты (при поступлении)»

VAR67=«Тромбоциты (при поступлении)»

VAR68=«Общая КФК (при поступлении)»

VAR69=«Общая КФК (максимальное значение)»

VAR70=«МВ-КФК (при поступлении)»

VAR71=«МВ-КФК (максимальное значение)»

VAR72=«Тропонин Т (при поступлении)»

VAR73=«Тропонин Т (максимальное значение)»

VAR74А=«ХСН на день исслед»

VAR75А=«КАГ»

VAR76А=«Стеноз ≥50% ствола ЛКА»

VAR77А=«Стеноз ≥50% ПНА»

VAR78А=«Стеноз ≥50% ОА»

VAR79А=«Стеноз ≥50% ПКА»

VAR80А=«Стеноз ≥50% ДВ»

VAR81А=«Стеноз ≥50% ВТК»

VAR82А=«Стеноз ≥50% шунта»

VAR83А=«ЧКВ»

VAR86A=«Число сосудов с БАП»

VAR87A=«Тромбоз стента имплант наст госпитал»

VAR88A=«Показано ЧКВ на другом сегменте»

VAR89A=«ТЛТ»

VAR90A=«Препарат для ТЛТ»

VAR91A=«Эффективность тромболизиса»

VAR92А»=доАспирин»

VAR93А=«доКлопидогрель»

VAR94А=«до Варфарин»

VAR95А=«доВ-блокаторы»

VAR96А=«до Ингибиторы АПФ»

VAR97А=«до БРАТ II «

VAR98А=«до Блок Са каналов (дигидропирид)»

VAR99А=«до Блок Са каналов (недигидропирид)»

VAR100А=«до Дигоксин»

VAR101А=«до Петлевые диуретики»

VAR102А=«до Тиазидные диуретики»

VAR103А=«до Спиронолактон»

VAR104А=«до Нитраты»

VAR105А=«до Статины»

VAR106А=«до Кордарон»

VAR107А=«до Инсулин»

VAR108А=«до Метформин»

VAR109А=«до Другие СМ»

VAR110А=«до Другие ССП»

VAR111А=«Нагрузочная доза аспирина»

VAR112А=«Аспирин в стационаре»

VAR113А=«Нагрузочная доза клопидогреля»

VAR114А=«Клопидогрель в стационаре»

VAR115А=«Варфарин»

VAR116А=«НФГ догоспитально»

VAR117А=«НФГ в/в в первые 24 часа»

VAR118А=«НФГ п/к»

VAR119А=«Ингибиторы GP IIb/IIIa рец»

VAR120А=«НМГ догоспитально»

VAR121А=«НМГ»

VAR122А=«Фондапаринукс»

VAR123А=«Бета-блокаторы»

VAR124А=«Ингибиторы АПФ»

VAR125А=«БРАТ II»

VAR126А=«Блок Са каналов (дигидропиридин)»

VAR127А=«Блок Са каналов (недигидропиридин)»

VAR128А=«Дигоксин»

VAR129А=«Петлевые диуретики»

VAR130А=«Тиазидные диуретики»

VAR131А=«Спиронолактон»

VAR132А=«Нитраты»

VAR133А=«Статины»

VAR134А=«Кордарон»

VAR135А=«Инсулин»

VAR136А=«Метформин»

VAR137А=«Другие СМ»

VAR138А=«Другие ССП»

VAR139А=«СТАЦ  Аспирин»

VAR140А=«СТАЦ  Клопидогрель»

VAR141А=«СТАЦ  Варфарин»

VAR142А=«СТАЦ  НФГ в/в»

VAR143А=«СТАЦ  НФГ п/к»

VAR144А=«СТАЦ  Ингиб GP IIb/IIIa рец»

VAR145А=«СТАЦ  НМГ»

VAR146А=«СТАЦ  Фондапаринукс»

VAR147А=«СТАЦ  Бета-блокаторы»

VAR148А=«СТАЦ  Ингибиторы АПФ»

VAR149А=«СТАЦ  БРАТ II»

VAR150А=«СТАЦ  Блок Са каналов (дигидропирид)»

VAR151А=«СТАЦ  Блок Са каналов (недигидропир)»

VAR152А=«СТАЦ  Дигоксин»

VAR153А=«СТАЦ  Петлевые диуретики»

VAR154А=«СТАЦ  Тиазидные диуретики»

VAR155А=«СТАЦ  Спиронолактон»

VAR156А=«СТАЦ  Нитраты»

VAR157А=«СТАЦ  Статины»

VAR158А=«СТАЦ  Кордарон»

VAR159А=«СТАЦ  Инсулин»

VAR160А=«СТАЦ  Метформин»

VAR161А=«СТАЦ  Другие СМ»

VAR162А=«СТАЦ  Другие ССП»

VAR163А=«Впервые выявленный СД»

VAR164А=«ранняя постинфаркт стенокардия»

VAR165А=«рецидив инфаркта миокарда»

VAR166А=«Дата и время рецидива»

VAR167А=«развитие ишемического инсульта»

VAR168А=«развитие геморрагич.  инсульта (ГИ)»

VAR169А=«развитие ТИА»

VAR170А=«Остановка сердца»

VAR171А=«Дата и время остановки сердца»

VAR172А=«Механические осложнения»

VAR173А=«Развития тампонады сердца»

VAR174А=«Дата и время тампонады»

VAR175А=«Перфорация при ЧТКА или КАГ»

VAR176А=«Тромбоэмболические осложнения»

VAR177А=«Развития кардиогенного шока»

VAR178А=«Дата и время развития КШ»

VAR179А=«Развитие отёка легких»

VAR180=«Дата и время разв-я отёка лёгких»

VAR181А=«опасные нарушения ритма и проводимости»

VAR182А=«Смерть за время госпитализации»

VAR183=«Дата и время смерти»

VAR184А=«Причина смерти»

VAR185А=«Исход»

VAR186=«Количество дней в стационаре»

VAR187А=«Окончательный диагноз»

VAR188А=«Выполнялось вскрытие»

VAR189А=«Совпадение диагнозов»

VAR190=«Сегмент №1»

VAR191=«Сегмент №2»

VAR192=«Сегмент №3»

VAR193=«Сегмент №»4

VAR194=«Сегмент №5»

VAR195=«Сегмент №6»

VAR196=«Сегмент №7»

VAR197=«Сегмент №8»

VAR198=«Сегмент №9»

VAR199=«Сегмент №10»

VAR200=«Сегмент №11»

VAR201=«Сегмент №12»

VAR202=«Сегмент №13»

VAR203=«Сегмент №14»

VAR204=«Сегмент №15»

VAR205=«Нв на день исслед»

VAR206=«P O2»

VAR207=«P CO2»

VAR208=«PH»

VAR209=«Sp O2»

VAR210=«Sp O2 на день исслед»

VAR211=«ЖЕЛ(FVC).  Литры»

VAR212=«% должЖЕЛ»

VAR213А=«градация ЖЕЛ»

VAR214=«ОФВ1(FEV1), литры»

VAR215=«% должОФВ1»

VAR216А=«градация ОФВ1»

VAR217=«ОФВ1/ФЖЕЛ (FEV1/FVC), % факт»

VAR218А=«градация инд Тиффно»

VAR219=«МОС 25% (FEF), литры»

VAR220=«% долж МОС 25%»

VAR221А=«градация МОС 25%»

VAR222=«МОС 75% (FEF), литры»

 

VAR223=«% долж МОС 75%»

VAR224А=«градация МОС 75%»

VAR225=«МОС 25-75% (FEF), литры»

VAR226=«% МОС 25-75%»

VAR227А=«градация МОС 25-75%»

VAR228=«ПСВ (FEF) Max, литры»

VAR229=«% ПСВ(FEF)»

VAR230А=«градация ПСВ»

VAR231=«FIVC, литры»

VAR232=«FIF Max, литры»

VAR233АТип вентиляции»

VAR234=«ЖЕЛ (SVC),л»

VAR235=«% ЖЕЛ»

VAR236А=«градация   ЖЕЛ»

VAR237=«ЁЛ (IC),л»

VAR238=«%ЕЛ»

VAR239А=«градация   ЕЛ»

VAR240=«РОВыд (ERV),л»

VAR241=«%РОВыд»

VAR242А=«градация РОВыд»

VAR243=«ВГО (TGV), л»

VAR244=«% ВГО»

VAR245А=«градация ВГО»

VAR246=«ООЛ(RV), л»

VAR247=«% ООЛ(RV)»

VAR248А=«градация ООЛ»

VAR249=« ОЕЛ (TLC), л»

VAR250=«% ОЕЛ(TLC)»

VAR251А=«градация ОЕЛ»

VAR252=«RV/TLC, % фактич»

VAR254А=«градация RV/TLC»

VAR255=«DLCOunc»

VAR256=«% DLCOunc»

VAR257=«DLCOcor»

VAR258=«% DLCOcor»

VAR259А=«степень снижения DLCOcor»

VAR260=«DL/VA»

VAR261=«% DL/VA»

VAR262А=«градация DL/VA»

VAR263=«VA»

VAR264=«% VA»

VAR265Аградация VA»

VAR266=«Raw»

VAR267=«% Raw»

VAR268Аградация Raw»

 VAR269=«Gaw»

VAR270=«% Gaw»

VAR271Аградация Gaw»

VAR272=«sRaw»

VAR273А=«градация sRaw»

VAR274=«sGaw»

VAR275=«% sGaw»

VAR276А=«градация sGaw»

VAR277=«КДР ЛЖ, СМ»

VAR278А=«КДР шифр»

VAR279=«КДО ЛЖ, МЛ»

VAR280А=«КДО шифр»

VAR281=«КСР ЛЖ, СМ»

VAR282А=«КСР шифр»

VAR283=«КСО ЛЖ, МЛ»

VAR284А=«КСО шифр»

VAR285=«ЛП, СМ»

VAR286А=«ЛП шифр»

VAR287А=«ПП шифр»

VAR288=«ПЖ (см)»

VAR289А=«ПЖ шифр»

VAR290=«МЖП, СМ»

VAR291=«ЗСЛЖ, СМ»

VAR292А=«наличие ГЛЖ»

VAR293=«ПРЛЖд»

VAR294=«ПРЛЖс»

VAR295=«ИОТ»

VAR296А=«ИОТ шифр»

VAR297А=«тип ремоделирования миокарда»

VAR298=«ИСC»

VAR299А=«ИСС шифр»

VAR300=«ИСИР»

VAR301=«ФВ(ТЕЙХОЛЬЦ)»

VAR302А=«уровень снижения ФВ»

VAR303=«КОРЕНЬ АО, СМ»

VAR304=«ВОСХ АО, СМ»

VAR305А=«МК-РЕГ»

VAR306=«ПИК Е»

VAR307=«ПИК А»

VAR308=«Е\А»

VAR309=«DT»

VAR310=«ВИР»

VAR311А=«Диаст. Дисфункция»

VAR312А=«АК-РЕГ»

VAR313А=«ТК-РЕГ»

VAR314=«СДЛА»

VAR315А=«Степень гипертензии»

VAR316=«УО»

VAR317А=«УО шивр»

VAR318=«УИ»

VAR319А=«УИ шифр»

VAR320=«Площадь поверхности тела»

VAR321=«КДИ»

VAR322А=«КДИ шифр»

VAR323=«КСИ»

VAR324А=«КСИ шифр»

VAR325=«ММЛЖ»

VAR326А=«ММЛЖ шифр»

VAR327=«ИММЛЖ»

VAR328А=«ИММЛЖ шифр»

VAR329А=«Острая аневризма ЛЖ»

VAR330А=«Тромб в полости ЛЖ»

VAR331А=«Нарушения локальной сократимости»

VAR332А=«Дисфункция папиллярных мышц»

Среди многих задач по анализу этого массива, одной из наиболее интересных была задача оценки уравнения логит-регрессии для признака VAR4A=«Смерть в период настоящей госпитализации». Данный признак имеет 2 градации: 1='нет', 2='да'. Для этого признака было получено несколько десятков уравнений, которые обеспечивали показатель конкордации в интервале 80-99%.

При оценке уравнений логит-регрессии по массивам с большим списком потенциальных предикторов, имеется возможность оценки столь же большого набора таких уравнений. Это обусловлено тем, что состав потенциальных предикторов можно целенаправленно регулировать. Для этого можно вначале оценить все парные связи между зависимым признаком и всеми остальными потенциальными предикторами. Далее отобрать в качестве потенциальных предикторов только те признаки, которые имеют статистически значимые связи с зависимым показателем.  Другой подход к формированию списка потенциальных предикторов связан с возможностями реального изменения значений предикторов, вошедших в уравнение для целенаправленного увеличения вероятности нужного исхода. Например, в данном массиве таким исходом для признака VAR4A=«Смерть в период настоящей госпитализации» будет исход «нет». 

Следующий подход к выбору списка потенциальных предикторов заключается в последовательном отборе предикторов ранее вошедших в уравнение логит-регрессии, и при этом имеющих максимальные значения модулей стандартизованных коэффициентов регрессии. Не меньшую важность имеет и тактика окончательного отбора наиболее интересных уравнений логит-регрессии из некоторого набора таких уравнений. Напомним, что каждое уравнение позволяет вычислить вероятности отнесения всех  наблюдений в отдельные подгруппы зависимого признака. При этом наблюдение относится в ту подгруппу, для которой вероятность, вычисленная по уравнению, максимальна.

Рассмотрим случай бинарной логит-регрессии, обозначив вероятность отнесения наблюдения к первой подгруппе через р1, а ко второй подгруппе – р2. Для некоторого наблюдения получены две вероятности:  р1=0,4461 ; р2=0,5539. В этом случае наблюдение будет отнесено ко второй подгруппе. Однако это же решение будет принято и для другого случая:  р1=0,0461 ; р2=0,9539. Очевидно, что во втором случае решение об отнесении данного наблюдения ко второй подгруппе более надёжно, нежели в первом случае. Имея в своём распоряжении вычисленные вероятности отнесения к обеим подгруппам для разных вариантов уравнений, несложно оценить средние вероятности отнесения к каждой подгруппе. Далее провести сравнение этих средних для одной и тоже подгруппы, но полученные по разным уравнениям. Далее можно сравнить дисперсии этих оценок и т.д. Т.е. вычисленные вероятности могут быть использованы для сравнения уравнений между собой и выбора более привлекательных уравнений.

 


Далее: 3. Логистическая регрессия. Примеры анализа реальных данных.

 

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Отзывы заказчиков по статистическому анализу данных

«Роющая деятельность кабана». Статья в "Независимой" газете... Сравниваем средние, а также и ... В. Леонов

     Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Такими новыми сравнениями являются проверки равенства дисперсий, коэффициентов корреляции, коэффициентов регрессии или векторов групповых средних, сравнение групп многомерными методами, и т.д. В статье объяснена большая ценность обнаружения не нормального распределения признака. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками. Что является важнейшим аргументом по формулировке списка проверки взаимосвязей важнейших признаков проводимого исследования. Специфика других сравнений хорошо иллюстрируется различными графиками, а также наличием списка литературы из 98 книг и статей, полезных для этой тематики. Причём более половины из них имеют ссылки на доступные в интернете данные издания. По традиции очередной годовщины нашего сайта, в две последние статьи размещены ещё и иные весьма полезные ссылки..


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.


23 примера оформления данных, их описания и описания целей исследования


В ноябре 2013 года сайту БИОМЕТРИКА исполнилось 16 лет. А что было раньше? И что теперь?


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко
 
ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.


Долгое прощание
с
лысенковщиной 

История науки не ограничивается перечислением успешных исследований. Она должна сказать нам о безуспешных исследованиях и объяснить, почему некоторые из самых способных людей не могли найти ключа знания, и как репутация других дала лишь большую опору ошибкам, в которые они впали.

Дж. Максвелл 

 

Функциональный кризис отечественной науки, переживаемый в последнее десятилетие, вынуждает беспристрастно анализировать основные причины этого явления [1-2, 45-47]. Последние результаты библиометрического анализа говорят о том, что вклад России в мировую науку по основным направлениям составляет уже порядка 5-8% [1-2]. По данным того же источника вклад США составляет 32-41%. 

Коммунистическая идеология, уродовавшая многие направления отечественной науки на потребу вождей, породила и такое явление, как лысенковщина. Для большинства читателей фамилия Лысенко ассоциируется с августовской сессией ВАСХНИЛ 1948 г. и разгромом генетики. Однако лысенковщину нельзя сводить только к запрету на генетику. Достигнув своего апогея в середине текущего века, и став воистину периодом средневековья в отечественной биологии и медицине, лысенковщина изуродовала и методологию этих наук, изгнав из них в частности математику, и в первую очередь статистику. Последствия этого уродства и по сей день не позволяют биологии и медицине приблизиться к статусу точных наук. В статье описаны основные этапы этого явления и особенности методологии применения статистики в биологии и медицине, полученные автором при анализе нескольких сот диссертаций и монографий а также более 1500 статей в области экспериментальной биомедицины. 

Ключевые слова: лысенковщина, биология, медицина, статистика, биостатистика, методологический кризис. 


Автор понимает, что поднятая им проблема достаточно обширна и не может быть полностью освещена в одной статье, содержащей лишь малую часть материалов готовящейся к изданию монографии, посвященной проблемам применения статистики в медицине и биологии. Автор будет признателен читателям, которые выскажут свой взгляд на эту проблему, а также смогут дополнить авторские материалы новыми примерами.  Обсуждаемая в данной статье проблема может быть решена только общими усилиями всех заинтересованных в этом специалистов.

Работая над этой статьей, мне довелось несколько раз встречаться с одним из ректоров медицинского вуза. Обсуждая с ним предлагаемые в статье меры, направленные на исправление этого неприглядного положения, я с изумлением услышал от него такой ответ: "Как ученый - я "За", а как ректор - "Против"! И если так мыслит и говорит ректор, доктор медицинских наук, член-корреспондент РАМН, то несложно понять отношение к этой проблеме рядовых сотрудников такого вуза. Не потому ли многие из них представлены в разделе КУНСТКАМЕРА, вместе с моим собеседником, своими диссертациями и статьями...

За те несколько лет, что прошли с момента публикации этой статьи, а также статей  "В новый век - с доказательной биомедициной"(ПОИСК, N 20 (522) 21 мая 1999) и "Куплю 500 диссертаций! (Медицинская Газета N10 за 14.02.2001)", практически ничего не изменилось. Да, в России стали писать и говорить о доказательной медицине, проводить конференции по этой тематике, а в некоторых медицинских вузах даже открыли центры доказательной медицины. Однако откроем биомедицинские журналы и диссертации, и станет ясно, что это не более чем дань моде... 

 

Материалы по науковедению

В новый век - с доказательной биомедициной



1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"