Яндекс.Метрика

Логистическая регрессия в медицине

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
". Д. Дидро

Статистика посещаемости БИОМЕТРИКИ Яндекс
цитирования
Индекс цитирования

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
Яндекс
цитирования
Яндекс цитирования
 

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят...


Введение
Наши возможности. О возможностях статистического анализа
Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35
Список научных и учебных изданий по биометрике и статистике
Материалы по науковедению
История биометрики
Статистическое рецензирование статей и диссертаций

Долгое прощание с лысенковщиной...
Семинар по биометрике в Красноярске



Если Вы сторонник использования
статистики, разместите на своём сайте
HTML-код нашего баннера:

BIOMETRICA - журнал для сторонников доказательной биологии и медицины
25 наиболее популярных ссылок, посещаемых нашими читателями
http://www.biometrica.tomsk.ru/comp_aver.htm
http://www.biometrica.tomsk.ru/erevan_8.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/UNESCO%202010.pdf
http://www.biometrica.tomsk.ru/zakaz.htm
http://www.biometrica.tomsk.ru/zakaz_28.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/STAT_CARDIO_2014.pdf
http://www.biometrica.tomsk.ru/logit_9.htm
http://www.biometrica.tomsk.ru/stat_cardio7.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/percent_00.htm
http://www.biometrica.tomsk.ru/lis.htm
http://www.biometrica.tomsk.ru/kamchat.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/zakaz_15.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

БИОМЕТРИКА + Музыка. В. Леонов.

Музыка... Вот что сказал о ней великий Иоганн Себастьян Бах: "Цель музыки - трогать сердца". В детстве автор этих строк получил музыкальное образование. Любимыми инструментами были мандолина и гитара. Любимыми композиторами - Вивальди, Бах, Альбиони, Боккерини, Беллини, Корелли, Скарлатти. В 80-е годы прошлого столетия в Томск часто приезжал с концертами маэстро Владимир Спиваков. Эти концерты организовывал Егор Лигачёв, бывший в ту пору первым секретарём Томского обкома КПСС. На свой первый концерт в Томск Владимир Спиваков приехал один. Великолепно играл на скрипке! Концертный зал был переполнен слушателями, которые были в восторге от его концерта. Именно тогда мне удалось впервые встретиться с ним, и взять у него автографы на его грампластинки. В дальнейшем посещал все его концерты. В 1979 г. В. Спиваков организовал камерный оркестр "Виртуозы Москвы". Однажды в 90-е годы Владимир Спиваков должен был приехать в Томск с "Виртуозами Москвы", и в течение трёх дней дать 3 концерта. Однако из-за проблем с топливом в те времена, их самолёт посадили в Омске, где они пробыли 2 дня. И когда прилетели в Томск, то в один день провели все 3 концерта, которые я прослушал. И вновь взял автографы на новые грампластинки, и сделал много фотографий В. Спивакова.


Музыка...  Она помогает всегда. Вот почему я рассылаю почти всем своим корреспондентам файлы с хорошей музыкой. Любите музыку, слушайте её чаще. И она поможет лучше понимать бистатистику и результаты статистического анализа...

13 февраля 2014 г. Владимир Спиваков и "Виртуозы Москвы" дали концерт в Краснодаре. Я посетил этот прекрасный концерт, и вновь встретился с Владимиром Теодоровичем. Подарил ему его грампластики, фотографии, и свою книгу.

Логистическая регрессия в медицине и биологии

В. Леонов

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5. Особенности логистической регрессии в акушерстве.
6. Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество уравнений логистической регрессии.


В данной серии статей, на уровне доступном для начинающих, рассмотрены основы логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Объяснено, что методу присуща множественность решений, что позволяет выбирать для использования в реальной врачебной практике наиболее удобные и надёжные тактики лечения. Рассмотрено использование метода к массивам данных, содержащим несколько сотен признаков. Показано, что корректное создание таких массивов и их анализ возможны лишь при участии биостатистиков на самых первых этапах таких исследований. Рассмотрена связь логистической регрессии и ROC-анализа. Приведены многочисленные уравнения логистической регрессии и ROC-кривые, полученные при анализе реальных данных. Объяснена целесообразность использования вместе с методом логистической регрессии набора методов анализа парных взаимосвязей между различными признаками, а также использование более сложных методов многомерной статистики

 

Логистическая регрессия. Примеры анализа реальных данных.

Новые исследовательские методы
- это те деревья, что очищают атмосферу
науки от углекислоты неточных
выводов и насыщают её кислородом
впервые открытых, увиденных
и понятых явлений.
____________
В.В. Парин

 

Для иллюстрации возможностей использования метода логистической регрессии ниже приведём описания небольшого набора наиболее интересных реальных массивов и полученных при этом результатов.

  Массив VERA, созданный кардиологом В.В. К., содержал в себе  более 90 признаков. Вот эти признаки:

NUMBER="Номер наблюдения"

GRUPPA="Группа"

VAR2A="Пол"

VAR3="Возраст"

VAR3A="Возраст классификация"

VAR4A="Кардиалгии"

VAR5A="Сердцебиение"

VAR6A="Перебои в работе сердца"

VAR7A="Обмороки"

VAR8A="Одышка"

VAR9A="Головная боль"

VAR10A="Головокружение"

VAR11A="Слабость"

VAR12A="Миопия"

VAR13="Рост"

VAR14="Вес"

VAR15="ИМТ"

VAR15A="Питание"

VAR16A="Конституция"

VAR17A="Сколиоз степень"

VAR18A="Сколиоз локализация"

VAR18АА="Сколиоз  Есть-нет"

VAR1822A="Килевидная деформация клетки+сколиоз"

VAR1823AA="Ворон-я деф-я клетки+сколиоз"

VAR19A="Прямая спина"

VAR20A="Усиление грудного кифоза"

VAR2022AA="Кил-я деф-я клетки+усиление гр кифоза"

VAR2023AA="Вор-я деф-я клетки+усиление гр кифоза"

VAR21A="Усиление поясничного лордоза"

VAR22A="Килевидная деформация грудной клетки"

VAR22АА="Килевид. Деф. Гр.кл. Есть-нет"

VAR2258A="Кил-я деф-я гр клетки+митр-я рег-ция"

VAR2260A="Кил-я деф-я гр клетки+трик-я рег-ция"

VAR23AA="Воронкообр деф-ция гр. Клетки Есть-Нет"

VAR2358A="Ворон-я деф-я гр клетки+митр-я рег-ция"

VAR2360A="Ворон-я деф-я гр клетки+трик-я рег-ция"

VAR2361A="Ворон-я деф-я гр клетки+аорт-я рег-ция"

VAR24A="Приросшие мочки"

VAR25A="Готическое небо"

VAR26A="Неправильный рост зубов"

VAR27A="Неправильный прикус"

VAR28A="Арахнодактилия"

VAR29A="Гиперподвижность суставов"

VAR30A="Варикозное расширение вен"

VAR31A="Плоскостопие"

VAR32A="Сандалевидная щель"

VAR33A="2-й палец стопы больше 1-го"

VAR34A="Грыжа"

VAR35="Аорта/вес"

VAR36="Аорта/рост"

VAR37="Аорта/ПлПТ"

VAR38="Аорта/ИМТ"

VAR39="Аорта/КСР ЛЖ"

VAR40="Аорта/КДР ЛЖ"

VAR41="Аорта/КСО"

VAR42="Аорта/КДО"

VAR43="Аорта/ИММЛЖ"

VAR44="Аорта/ММЛЖ"

VAR45="Аорта/ЛП"

VAR46="Аорта корень"

VAR47A="Расширение аорты"

VAR48="Левое предсердие"

VAR49="КДР ЛЖ"

VAR2261A="Кил-я деф-я гр клетки+аорт-я рег-ция"

VAR23A="Воронкообразная деф-ция гр. клетки"

VAR4913="VAR49/VAR13"

VAR4950="VAR49-(VAR50/VAR49"

VAR4962="VAR49/VAR62"

VAR50="КСР ЛЖ"

VAR51="ПЖ"

VAR52="ФВ"

VAR53="МЖП"

VAR54="ЗСЛЖ"

VAR5449="2*VAR54/VAR49"

VAR55A="Миксоматозная дегенерация створок"

VAR56="ПМК мм"

VAR57A="ПМК степень"

VAR58A="Митральная регургитация степень"

VAR59="ПТК мм"

VAR60A="Трикуспидальная регургитация степень"

VAR61A="Аортальная регургитация степень"

VAR62="Площадь тела"

VAR63="КДО"

VAR6362="VAR63/VAR62"

VAR64="КСО"

VAR6462="VAR64/VAR62"

VAR65="УО"

VAR66="МОК"

VAR67="УИ"

VAR68="СИ"

VAR69="ММ ЛЖ"

VAR70="ИММЛЖ"

VAR71A="АРХЛЖ"

VAR72A="Нефроптоз"

VAR73A="Аневризма МПП

Программа работы по данному массиву содержала в себе более 50 пунктов, среди которых несколько пунктов были посвящены анализу взаимосвязи ряда дискретных признаков с наборами предикторов методом логистической регрессии. Среди этих задач в качестве зависимых признаков выступали такие показатели, как VAR47A="Расширение аорты",  VAR60A="Трикуспидальная регургитация степень" и VAR61A="Аортальная регургитация степень", имеющие по 2-3 градации. В процессе анализа этих данных было получено порядка 50 статистически значимых уравнений, в которых показатели конкордации находились в интервал 88 – 97,9%.

 

              Следующий массив данных, созданный Е.В. Х. (Омск),  содержал 840 наблюдений и 20 признаков.

NUMBER="Номер наблюдения"

VAR1="возраст"

VAR2="рост"

VAR3="вес"

VAR4А="пол"

VAR5="длительность заболевания"

GRUPPA="тип течения заболевания"

VAR6А="ФС1"

VAR7А="ФС2"

VAR8А="ФC3"

VAR9А="ФС4"

VAR10А="ФС5"

VAR11А="ФС6"

VAR12А="ФС7"

VAR13А="EDSS"

VAR14="средняя скорость прогрессирования"

VAR15А="ген TNFa"

VAR16A="ген KIF1b"

VAR17A="ген CD40"

VAR18A="ген TNFRSF1A"

VAR19А="ген IL-18"

Одна из важнейших задач исследования заключалась в анализе связи признака GRUPPA="тип течения заболевания" с остальными предикторами, включая генетические показатели. Зависимая переменная имела 4 градации: 1="ремитт.", 2="Втор-прог", 3="перв-прог", 4="контроль".  Программа работ предусматривала различные варианты сравнения подгрупп. Уравнения, полученные в этих вариантах, имели различные показатели конкордации в интервал от 33 до 84%.

  Массив DATA (автор В.С.) содержал результаты наблюдений за 3 водоёмами и содержал 41 признак (см. список ниже).

NUMBER=«Номер наблюдения»

VAR1="Дата"

VAR2A="Год"

VAR3A="Водоём"

VAR4="Температура воды"

VAR5="Содержание кислорода"

VAR6="Минерализация"

VAR7="рН"

VAR8="Уровень воды в водоёме"

VAR9="Численность  Eylais bisinuosa"

VAR10="Численность Eylais koenikei"

VAR11="Численность Eylais extendens"

VAR12="Численность Eylais crassipons"

VAR13="Численность Eylais sp."

VAR14="Численность Hydrachna geographica"

VAR15="Численность Hydrahna crassipalpis"

VAR16="Численность Hydrachna sp. 1"

VAR17="Численность Hydrachna sp. 2"

VAR18="Численность Euthyas truncata"

VAR19="Численность Thyas dirempta"

VAR20="Численность Thyas barbigera"

VAR21="Численность Thyas distinctus"

VAR22="Численность Thyasides dentata"

VAR23="Численность Hydryphantes ruber"

VAR24="Численность Hydryphantes prolongatus"

VAR25="Численность Hydryphantes dispar"

VAR26="Численность Hydryphantes planus"

VAR27="Численность Hydryphantes tenuipalpis"

VAR28="Численность Hydryphantes crassipalpis"

VAR29="Численность Hydrodroma despiciens"

VAR30="Численность Tiphys latipes"

VAR31="Численность Tiphys ornatus"

VAR32="Численность Tiphys sp. dn"

VAR33="Численность Piona clavicornis."

VAR34="Численность Piona nodata"

VAR35="Численность Piona sp. 1"

VAR36="Численность Piona sp. 2"

VAR37="Численность Piona sp. 3"

VAR38="Численность Arrenurus papillator"

VAR39="Численность Arrenurus sp. 1"

VAR40="Численность Arrenurus sp. 2"

VAR41="Численность Arrenurus sp. 3"

В результате сравнения 3-х водоёмов были получены уравнения логистической регрессии, которые обеспечивали высокие значения показателя конкордации. Ниже приведены 2 варианта таких уравнений.

       

Сравнение этих двух уравнений показывает, что расширение списка предикторов приводит к увеличению показателя конкордации. При этом предиктор А1 – это один и тот же признак в обоих уравнениях. Как видим, коэффициенты данного предиктора имеют в этих уравнениях один и тот же знак, и достаточно близкие значения. Вместе с тем, во втором уравнении отчётливо видно доминирование предиктора А7.

 

  Очередной массив данных был создан аспирантом Э.К. из Москвы и содержал следующие признаки:

NUMBER="номер по порядку"

VAR2A="фамилия"

VAR3="возраст"

VAR4A="группа"

VAR5="длительность (лет)"

VAR6A="тип инсульта"

VAR7A="пол"

VAR8А="гемисфера"

VAR9A="степень спастичности в ноге"

VAR10A="степень спастичности в руке"

VAR11A="сила ноги поражённой стороны"

VAR12A="сила руки поражённой стороны"

VAR13А="Н-рефлекс правая рука"

VAR14А="Н-рефлекс левая рука"

VAR15А="Н-рефлекс правая нога"

VAR16А="Н-рефлекс левая нога"

VAR17="Отношение Н/М левая нога"

VAR18="Отношение Н/М правая нога"

VAR19="амплитуда максим. F-волны на левой ноге"

VAR20="Кол-во гигантских F-волн на левой ноге"

VAR21="амплит. макс. F-волны на правой ноге"

VAR22="Кол-во гигантских F-волн на правой ноге"

VAR23="амплитуда максим. F-волны на правой руке"

VAR24="Кол-во гигантских F-волн на правой руке"

VAR25="амплит. макс. F-волны на левой руке"

VAR26="Кол-во гигантских F-волн на левой руке"

VAR27="Отношение f/m правая рука"

VAR28="Отношение f/m левая рука"

VAR29="Отношение f/m правая нога"

VAR30="Отношение f/m левая рука"

VAR31="Процент волокон, содержащих миозин 1"

VAR32="Процент волокон, содержащих миозин 2"

VAR33="Площадь поперечного сечения миозин 1"

VAR34="Станд. отклон. площади миозин 1"

VAR35="коэфф. вариации площади миозин 1"

VAR36="Площадь поперечного сечения миозин 2"

VAR37="Станд. отклон. площади миозин 2"

VAR38="коэфф. вариации площади миозин 2"

VAR39="число капилляров в 1 кв. мм"

VAR40="число капилляров на 1 волокно"

VAR41="процент центральных ядер"

VAR42="ВЦМП: разница между руками"

VAR43="ВЦМП: разница рука-норма"

VAR44="ВЦМП: разница между ногами"

VAR45="ВЦМП: разница нога-норма"

VAR46="порог возбудимости правая рука"

VAR47="порог возбудимости левая рука"

VAR48="порог возбудимости правая нога"

VAR49="порог возбудимости левая нога"

VAR50="титин интактный"

VAR51="титин-2А"

VAR52="титин-2"

VAR53="небулин"

При анализе этого массива данных для 6 дискретных признаков были оценены уравнения логистической регрессии. Всего было получено более 40 уравнений, среди которых 10 уравнений для признака VAR6A="тип инсульта", имеющего 2 градации:  1="ишемический",  2="геморрагический". Ниже приведено одно из таких уравнений:

 

В данном уравнении отсутствует свободный член, поскольку в предыдущей оценке уровень его значимости равнялся 0,5697 , поэтому в текущей оценке была использована программа с опцией подавления свободного члена. Отметим, что при этом состав предикторов не изменился, как не изменились и знаки коэффициентов данных предикторов.

  Один из наиболее интересных массивов, в котором были получены весьма интересные результаты, был создан исследователем М.М. из Липецка. Массив содержал 612 наблюдений и около 50 признаков:

NUMBER=«Номер наблюдения»

VAR1="Год рождения женщины"

VAR2="Возраст женщины"

VAR3="Номер беременности"

VAR4="Количество абортов"

VAR5A="Нарушения менструального цикла"

VAR6="Первый день последней менструации"

VAR7A="Резус фактор"

VAR8A="Угроза прерывания в текущ. берем-ть"

VAR9A="Кровянистые выделения в текущ. берем-ть"

VAR10A="Грипп/ОРЗ/инфекции в текущ. берем-ть"

VAR11A="Наличие хронических заболеваний у мужа"

VAR12A="Заболевания в семье"

VAR13="Дата сдачи анализа"

VAR14="Срок берем-ти на момент сдачи анализа"

VAR15="Содержание АФП"

VAR16="Содержание АФП в МоМ"

VAR17="Вес женщины (кг)"

VAR18="Содержание ХГЧ"

VAR19="Содержание ХГЧ в МоМ"

VAR20="Содержание свободного эстриола"

VAR21А="Состояние здоровья новорожденного"

VAR22="Дата родов"

VAR23А="Пол ребенка"

VAR24="Масса новорожденного (г)"

VAR25="Рост новорожденного (см)"

VAR26="Окружность головы новорожденного (см)"

VAR27А="Характер родов"

VAR28="Кол-во гинекол-х заболеваний у женщины"

VAR29="Кол-во хронич-х заболеваний у женщины"

VAR30="Кол-во венер-х заболеваний у женщины"

VAR31="Кол-во маркеро-хромосом. патол-й по УЗИ"

VAR32="Кол-во профвредностей у женщины"

VAR33А="Курение женщины"

VAR34="Кол-во отклонений и забол-й у новор-го"

VAR35="Кол-во рожденных женщиной здор-х детей"

VAR36="Кол-во рожденных женщиной нездор-х детей"

VAR37="Кол-во выкидышей у женщины"

VAR38="Кол-во замерших беременностей у женщины"

VAR39="Дата проведения УЗИ"

VAR40="BPD "

VAR41="OFP"

VAR42="HC"

VAR43="AC"

VAR44="FL"

VAR45="Срок беременности по УЗИ в неделях"

VAR45D="Срок беременности по УЗИ в днях"

DELTA=" Разность между фактической продолжительностью Б-ти и по УЗИ (в днях)"

VAR46="Масса плода на момент УЗИ"

VAR47="Прогнозируемая дата родов по месячным"

VAR48="Прогнозируемая дата родов по УЗИ"

VAR49А="Отмечена ли малая масса у новорожденного"

  Одна из задач анализа данного массива состояла в оценке уравнения логистической регрессии для зависимого признака VAR49А="Отмечена ли малая масса у новорождённого". Ниже приведено одно из полученных уравнений, обеспечивающее показатель конкордации равный 87,5%.

 

  Как видим, в уравнение вошли два предиктора, примерно равные по интенсивности влияния на зависимую переменную, но имеющие при этом разные знаки. Т.е. оказывающие противоположные влияния на вероятность появления у новорождённого малой массы.

 

              Массив HRAM был создан ботаником Е.Х.  Исходный массив содержал 102 признака, однако в дальнейшем перечень переменных был сокращён до 35:

NUMBER=«Номер наблюдения»

VAR1A="Радиационное воздействие"

GRUPPA="Группа"

VAR3="Содержание Sr90"

VAR4="Содержание Cs137"

VAR5="Компонент1"

VAR6="Компонент2"

VAR7="Гиперозид"

VAR8="Изокверцитрин"

VAR9А="Компонент 5"

VAR10А="Компонент 6"

VAR11А="Компонент 7"

VAR12А="Компонент 8"

VAR13А="Компонент 9"

VAR14="Кверцитрин"

VAR15="Астрагалин"

VAR16="Компонент12"

VAR17="Кверцетин"

VAR18 ="Кемпферол"

VAR19="Сумма флавоноидов"

VAR20="Сумма флавонолов"

VAR21="Сумма агликонов"

VAR22="Гликозиды кверцетина"

VAR23="Гликозиды кемпферола"

VAR24="Сумма гликозидов"

VAR25="Площадь листа"

VAR26="Периметр листа"

VAR27="Длина листа"

VAR28="Ширина листа"

VAR29="Площадь конечной доли"

VAR30="Периметр конечной доли"

VAR31="Длина конечной доли"

VAR32="Ширина конечной доли"

VAR33="Длина черешка"

VAR34="Длина побега"

VAR35А="Количество листьев на побеге"

Одной из задач исследования было сравнение между собой 4-х групп растений, произрастающих в местностях с различной экологической ситуацией, включая наличие радиационного воздействия. Оценки уравнений логистической регрессии показали статистически значимые вклады от 6 до 12 предикторов. При этом показатель конкордации в этих уравнениях находился в интервале от 84 до 94%. В большинстве  уравнений наблюдались близкие по модулю значения стандартизованные коэффициенты. Лишь в двух уравнениях наблюдалось доминирование 2-3 предикторов.

 

              Исследователь М.К. использовал массив MARIYA, содержащий 100 признаков (см. ниже), для решения большого спектра задач в области акушерства и гинекологии. Среди них была и задача оценки зависимости исходов (признак V41) от метода хирургического лечения, характера воспаления, тяжести состояния и других используемых признаков.

NUMBER=«Номер наблюдения»

V1 –  код пациента

V2 – возраст

V3 – характер воспалительного процесса

2 – гнойное

V4 – лечение

V5 – длительность пребывания в стационаре

V6 – температура при поступлении

V7 – общее состояние при поступлении

V8 – осложнения воспаления

V9 – послеоперационные осложнения

V10 – число лейкоцитов

V11 – эозинофилы

V12 – миелоциты

V13 – палочкоядерные

V14 – сегментоядерные

V15 – лимфоциты

V16 – моноциты

V17 – юные

V18 – СОЭ

 

Антигены HLA (цифры обозначают порядковые номера антигенов, а не числовые значения)

V19 – А1

V20 – А2

V21 - В1

V22 – В2

 

Содержание цитокинов в сыворотке крови до лечения

V23 – ИЛ-1

V24 – ИЛ-8

V25 – ИЛ-4

V26 – ФН

 

Содержание цитокинов в перитонеальной жидкости до лечения

V27 - ИЛ-1

V28  – ИЛ-8

V29  – ИЛ-4

V30  – ФН  

Содержание цитокинов в сыворотке крови после лечения

V31 - ИЛ-1

V32 – ИЛ-8

V33 – ИЛ-4

V34 – ФН

Содержание цитокинов в перитонеальной жидкости после лечения

V35 - ИЛ-1

V36 - ИЛ-8

V37  – ИЛ-4

V38  – ФН

V39 – хирургическое лечение

V40 – объем оперативного

V41 – исходы

V42 – метод контрацепции

V43 – семейный статус

V44 – число родов

V45 – число мед. абортов

V46 – число выкидышей

V47 – группа крови

V48 – посевы из церв. Канала

 V49 – посевы из брюшной полости

 

Наличие заболеваний в соматическом анамнезе

V50 - ОРЗ

V51 – хр. Тонзиллит

V52 - эндокринопатия

V53 – заболевания почек

V54 – заболевания ЖКТ

V55 – заболевания легких

V56 – заболевания сердца

V57 – анемия

V58 - аппендэктомия

V59 – сифилис

V60 – гепатит

Наличие заболеваний в гинекологическом анамнезе

V61 – хр. Аднексит

V62 – метроэндометрит

V63 – бартолинит

V64 – миома

V65 – эндоцервицит

V66 – НОМЦ

V67 – операции

V68 – бесплодие

V69 – гонорея

V70 – хламидиоз

V71 – трихомонады

V72 – гарднереллез

V73 – уреаплазмоз

V74 – кандидоз

 

Симптомы

V75 – лихорадка

V76 – озноб

V77 – слабость

V78 – тошнота, рвота

V79 – сухость во рту

V80 – жидкий стул

V81 – тазовые боли

V82 – межменструальные кровотечения

V83 – бели

V84 – дизурия

V85 – диспареуния

 

Данные осмотра

V86 – болезненность внизу живота

 V87 – симптомы раздражения брюшины

V88- увеличенные придатки

V89 – болезненные придатки

V90 – параметрит

V91 – болезненность при элевации

V92 – патологические выделения

 

Ультразвуковая картина

V93 – увеличенные придатки

V94 – патологические образования яичников

V95 – патологические образования труб

V96 – спаечный процесс

V97 – ТОА

V98 – выпот

V99 – миома

V100 – параметрит

Зависимый признак V41 – исходы, имеет 4 градации: 1 – выздоровление, 2 – ремиссия до 1 года, 3 – ремиссия более 6 месяцев, 4 – обострение ранее 6 месяцев. В результате решения этой задачи было получено более 20 уравнений с показателями конкордации в интервале от 75 до 97%. Отличие этого показателя объясняется как различием наборов потенциальных предикторов, так и различием используемых при этом алгоритмов и опций оценки. Наличие нескольких уравнений, которые можно использовать во врачебной практике для увеличения вероятности нужного исхода, например, выздоровления пациентки, предоставляет врачу большую свободу выбора. Кроме того, в этом случае возможно сравнить различные тактики достижения нужного исхода с экономических позиций, а также в случае отсутствия нужного результата использовать другое уравнение и другую тактику.

  Массив данных MICRO из 708 наблюдений и 31 признака (см. ниже), был создан исследователем А.В. из Н. Новгорода.

NUMBER="Номер наблюдения"

SOST="Состояние здоровья"

VG="Возрастная группа"

VAR1="Bifidobacterium spp."

VAR2="Lactobacillus spp."

VAR3="Streptococcus lactis"

VAR4="Анаэробные кокки"

VAR5="Bacteroides spp."

VAR6="Echerichia coli (лак +)"

VAR7="E. coli л/д"

VAR8="E. coli (лак=")"

VAR9="E. coli (гем+)"

VAR10="E. coli всего"

VAR11="Enterococcus spp."

VAR12="Enterococcus гем+"

VAR13 ="Staphylococcus epidermis"

VAR14 ="Staphylococcus aureus"

VAR15 ="Klebsiella spp."

VAR16="Enterobacter spp."

VAR17=" Citrobacter spp"

VAR18="Proteus mirabilis"

VAR19="Morganella morganii"

VAR20="Proteus vulgaris"

VAR21="Providencia spp"

VAR22="Hafnia spp."

VAR23="Pseudomonas aureginosa"

VAR24="HГОБ"

VAR25="Candida albicans"

VAR26="Дрожжи"

VAR27="shigella spp."

VAR28="salmonella spp. "

VAR29=" ЭПКП spp."

Целью исследования было изучение особенностей распределения микрофлоры кишечника больных и здоровых пациентов в поликлиниках и больницах разных районов г. Н. Новгорода. Одной задач, решаемых для достижения этой цели, была оценка уравнения логит-регрессии для зависимого признака SOST, имеющего две градации: 1="БОЛЬНЫЕ", 2="ЗДОРОВЫЕ". Более 10 уравнений полученных для зависимого признака SOST включали в себя от 5 до 12 предикторов, обеспечивающих показатель конкордации в интервале от 80 до 98%.

  Для изучения генетических особенностей течения бронхиальной астмы исследователь М.К. создал массив данных, включающий 18 признаков.

NUMBER="Номер наблюдения"

VAR3A="Полиморфизм 894 GT"

VAR4A="Полиморфизм в 4 интроне VNTR"

VAR5A="Полиморфизм 774 СТ"

VAR6A="Пол"

VAR7="Возраст"

VAR8A="Тяжесть Бронхиальной астмы"

VAR9="Диаметр Лёгочной артерии"

VAR10="Индекс лёгочной артерии"

VAR11="Среднее давление в правом желудочке"

VAR12="Среднее давление лёгочной артерии"

VAR13="Общее лёгочное сопротивление"

VAR14="Оксид азота"

VAR15="Среднее давление правом желудочке"

VAR16="Прирост диаметра"

VAR17="Коэффициент дисфункции"

VAR18="Прирост диаметра при повторном исследовании"

VAR19="Коэффициент дисфункции при повт иссл"

Метод логистической регрессии был использован в этом исследовании для оценки взаимосвязи генетических показателей с остальными признаками, а также для оценки взаимосвязи признака VAR8A="Тяжесть Бронхиальной астмы" со всеми остальными показателями. Вот как выглядело одно из уравнений для зависимой переменной VAR8A="Тяжесть Бронхиальной астмы":

Данное уравнение включало в себя 2 генетических показателя и обеспечивало при этом показатель конкордации равный 96,6%.

Массив данных К.А. содержал 300 наблюдений и 27 признаков:

NUMBER=«Номер наблюдения»

VAR1A="Группа"

VAR2="Возраст"

VAR3A="Пол"

VAR4="койко-день"

VAR5A="Период"

VAR6="Всего санаций"

VAR7A="Исход"

VAR8="Эритроциты"

VAR9="Гемоглобин"

VAR10="Лейкоциты"

VAR11="Сегментоядерные"

VAR12="Юные"

VAR13="Палочки"

VAR14="Миелоциты"

VAR15="Плазмоциты"

VAR16="Лимфоциты"

VAR17="Моноцититы"

VAR18="Эозинофилы"

VAR19="Биохимия"

VAR20="Глюкоза"

VAR21="АЛТ"

VAR22="АСТ"

VAR23="Амилаза"

VAR24="Мочевинa"

VAR25="Креатин"

VAR26="Фибриноген"

VAR27="Диастаза"

 При анализе этого массива одной из задач исследования была оценка уравнений логит-регрессии для зависимого признака VAR7A="Исход", имевшего две градации: 1 – выздоровление. 2 – смерть. Оценки 10 уравнений показали, что в 8 таких уравнениях среди 5-8 предикторов обязательно присутствуют 3 признака. Причём при значениях показателя конкордации 90-97% эти 3 признака обеспечивали 50-60%.

 

            Массив DATA_V (автор Ю.К., Беларусь) содержит 8626 наблюдений за животными по 52 признакам.  Ниже приведён список этих переменных.

NUMBER=«Номер наблюдения»

GRUPPA=«группа животных»

VAR1A=«больной/здоровый»

VAR2A=«порода»

VAR4A=«год опыта»

VAR5A=«область/район исследований»

VAR5AA=«область исследований»

VAR4 =«концентрация альбумина, г/л»

VAR5 =«концентрация общего белка, г/л»

VAR6 =«концентрация глюкозы, ммоль/л»

VAR7 =«концентрация триглециридов, ммоль/л»

VAR8 =«концентрация кальция, ммоль/л»

VAR9 =«концентрация фосфора, ммоль/л»

VAR10 =«концентрация АЛТ, U/л»

VAR11 =«концентрация АСТ, U/л»

VAR12 =«количество лейкоцитов, х109/л»

VAR13 =«количество эритроцитов, х1012/л»

VAR14 =«концентрация гемоглобина, г/л»

VAR15 =«гематокрит, %»

VAR16 =«средний объем эритроцитов, фл»

VAR17=«ср.содерж-е гемогл. в эритроцитах, пг»

VAR18 =«ср. конц-я гемогл. в эритроците, г/дл»

VAR19 =«средний суточный привес, г»

VAR20 =«концентрация лития, нг/кг»

VAR21 =«концентрация бериллия, нг/кг»

VAR22 =«концентрация натрия, мг/кг»

VAR23 =«концентрация магния, мг/кг»

VAR24 =«концентрация алюминия, мг/кг»

VAR25 =«концентрация калия, мг/кг»

VAR26 =«концентрация ванадия, нг/кг»

VAR27 =«концентрация хрома, мг/кг»

VAR28 =«концентрация марганца, мг/кг»

VAR29 =«концентрация железа, мг/кг»

VAR30 =«концентрация кобальта, мг/кг»

VAR31 =«концентрация никеля, мг/кг»

VAR32 =«концентрация меди, мг/кг»

VAR33 =«концентрация цинка, мг/кг»

VAR34 =«концентрация астата, нг/кг»

VAR35 =«концентрация селена, мг/кг»

VAR36 =«концентрация стронция, мг/кг»

VAR37 =«концентрация серебра, нг/кг»

VAR38 =«концентрация кадмия, мг/кг»

VAR39 =«концентрация цезия, нг/кг»

VAR40 =«концентрация бария, мг/кг»

VAR41 =«концентрация ртути, нг/кг»

VAR42 =«концентрация таллия, нг/кг»

VAR43  =«концентрация свинца, нг/кг»

VAR44  =«концентрация висмута, нг/кг»

VAR2930=«VAR29/VAR30» 

VAR2932=«VAR29/VAR32» 

VAR2933=«VAR29/VAR33» 

VAR3032=«VAR30/VAR32» 

VAR3033=«VAR30/VAR33» 

VAR3233=«VAR32/VAR33»  

Одной из задач исследования было сравнение подгруппы больных животных с подгруппой здоровых животных. В результате использования разных алгоритмов оценки, было получено несколько уравнений. Ниже приведено одно из них:

   Показатель конкордации для данного уравнения составил 92,4%. Отметим, что при оценке уравнений  в данной задаче были выявлены несколько доминирующих переменных, которые обеспечивали большую долю показателя конкордации.

   Как уже говорилось ранее, использование метода логистической регрессии в исследовании имеет двоякую цель. С одной стороны, это оценка модели, объясняющей различие двух или более многомерных групп наблюдений. При таком сравнении используются не только различия групповых средних для количественных предикторов, и мод для качественных предикторов, но также и информация о внутренних связях этих предикторов между собой. Присутствие в уравнении многих предикторов в уравнении как раз и говорит о том, что имеется много таких значимых связей. Т.е. фактически это свидетельство сложности модели взаимодействия зависимого признака с имеющимися предикторами. 

   Напомним также, что для оценки вероятности отнесения конкретного наблюдения к той или иной подгруппе необходимо вычислить параметр beta= a0 + a1*X1 +  a2*X2 + … +   aj*Xj . Очевидно, чем больше предикторов входит в уравнение логит-регрессии, тем больше потребуется усилий для вычисления параметра beta и далее оценки вероятностей. Поэтому в тех случаях, когда уравнение логистической модели содержит много предикторов, обязательно следует анализировать динамику изменения показателя конкордации при каждом увеличении списка предикторов. Например, при оценке приведённого выше уравнения уже после включения в уравнение 4-х предикторов А11, А12, А4 и А21 (см. ниже) показатель конкордации уже был равен 89,3%.

            Непосредственно к данному массиву и задаче примыкает другой массив, собранный тем же автором. Если в первой случае производилось сравнение подгрупп здоровых и больных животных, то во втором случае сравнивались три вида кормов, которые скармливались животным. Ниже приведён список проанализированных  признаков.

NUMBER=«Номер наблюдения»

VAR4A=«год опыта»

VAR5A=«область/район исследований»

VAR5AA=«область исследований»

КGRUPPA=«тип корма по этапам откорма»

KVAR1A=«тип корма»

KVAR2=«содержание сухого вещества, кг»

KVAR3=«содержание каротина, г»

KVAR4=«содержание кормовых единиц»

KVAR5=«содержание обменной энергии, МДж»

KVAR6=«содержание сырого протеина, г»

KVAR7=«содержание переваримого протеина, г»

KVAR8=«содержание сырого жира, г»

KVAR9=«содержание сырой клетчатки, г»

KVAR10=«содержание сырой золы, г»

KVAR11=«содержание кальция, г»

KVAR12=«содержание фосфора, г»

KVAR13=«рН»

KVAR14=«количество молочной кислоты, %»

KVAR15=«количество уксусной кислоты, %»

KVAR16=«количество масляной кислоты, %»

KVAR17=«концентрация лития, нг/кг»

KVAR19=«концентрация натрия, мг/кг»

KVAR20=«концентрация магния, мг/кг»

KVAR21=«концентрация алюминия, мг/кг»

KVAR22=«концентрация калия, мг/кг»

KVAR23=«концентрация кальция, мг/кг»  

KVAR24=«концентрация ванадия, нг/кг»

KVAR25=«концентрация хрома, мг/кг»

KVAR26=«концентрация марганца, мг/кг»

KVAR27=«концентрация железа, мг/кг»

KVAR28=«концентрация кобальта, мг/кг»

KVAR29=«концентрация никеля, мг/кг»

KVAR30=«концентрация меди, мг/кг»

KVAR31=«концентрация цинка, мг/кг»

KVAR32=«концентрация астата, нг/кг»

KVAR33=«концентрация селена, мг/кг»

KVAR34=«концентрация стронция, мг/кг»

KVAR35=«концентрация серебра, нг/кг»

KVAR36=«концентрация кадмия, мг/кг»

KVAR37=«концентрация цезия, нг/кг»

KVAR38=«концентрация бария, мг/кг»

KVAR39=«концентрация ртути, нг/кг»

KVAR40=«концентрация таллия, нг/кг»

KVAR41=«концентрация свинца, нг/кг»

KVAR42=«концентрация висмута, мг/кг»

KVAR43=«LEC 1 фр лектинов экс 2% NaCl ЕА/50 мкл»

KVAR44=«LEC 2 фр лектинов экс 0,9%NaCl ЕА/50 мкл»

KVAR45=«LEC 3 фр лектинов ацетоновая ЕА/50 мкл»

KVAR46=«LEC 4 фр лектинов надосадочная ЕА/50 мкл»

KVAR47=«LEC 5 фр лектинов осадочная ЕА/50 мкл»

KVAR48=«арабан мг/кг»

KVAR49=«фитин г/кг»

KVAR50=«фенолы»

K2728=«KVAR27/KVAR28»

K2730=«KVAR27/KVAR30» 

K2731=«KVAR27/KVAR31» 

K2830=«KVAR28/KVAR30»

K2831=«KVAR28/KVAR31»

K3031=«KVAR30/KVAR31»

В качестве зависимой переменной принималась переменная КGRUPPA=«тип корма по этапам откорма», имеющая 3 градации: 1=1 этап откорма, 2=2 этап откорма, и 3=3 этап откорма. Как и в первом массиве, были получены несколькими алгоритмами разные уравнения, одно из которых приведено ниже.

 

Показатель конкордации для данного уравнения составил 92%. Отметим, что при оценке уравнений  в данной задаче были выявлены несколько доминирующих переменных, которые обеспечивали большую долю показателя конкордации.

  Следующий массив, созданный Е.К. (г. Сургут) при изучении метаболического синдрома у женщин в менопаузе, состоял из 248 наблюдений и включал в себя 71 признак, которые приведены ниже.

 

NUMBER="Номер наблюдения"

GRUPPA="Группа пациентов"

GR="Состояние здоровья пациентов"

FIO="ФИО пациента"

GOD_R="год рождения пациента"

DMP1="Длительность менопаузы"

VAR1="возраст пациента на 2011 г "

VAR2="возраст начала наблюдения"

VAR3="возраст начала менопаузы"

VAR4="Длительность прож на Севере"

VAR5="Рост, м"

VAR6="Рост, кв. м"

VAR7="Вес, кг исходно"

VAR8="ИМТ кг/м? исходно"

VAR9="Вес, кг через 3 г "

VAR10="ИМТ кг/м? через 3 г "

VAR11="ОТ исходно"

VAR12="ОТ через 3 г "

VAR13="ОБ исходно"

VAR14="ОБ через 3 г "

VAR15="ОТ/ОБ исходно"

VAR16="ОТ/ОБ через 3 г "

VAR17="ЛПНП исходно"

VAR18="ЛПНП через 3 г "

VAR19="ЛПОНП исходно"

VAR20="ЛПОНП через 3 г "

VAR21="ХС исходно"

VAR22="ХС через 3 г "

VAR23="ТГ исходно"

VAR24="ТГ через 3 г "

VAR25="ЛПВП исходно"

VAR26="ЛПВП через 3 г "

VAR27="КАТ исходно"

VAR28="КАТ через 3 г "

VAR29="ТГ/ХС ЛПВП исходно"

VAR30="ТГ/ХС ЛПВП через 3 г "

VAR31="глюкоза натощак исходно"

VAR32="глюкоза натощак через 3 г "

VAR33="Глюк с нагрузкой исходно"

VAR34="Глюк с нагрузкой через 3 г "

VAR35="Инсул баз исходно"

VAR36="Инсул баз через 3 г "

VAR37="Инс. Реакт исходно"

VAR38="Инс. Реакт через 3 г "

VAR39="индекс Caro исходно"

VAR40="индекс Caro через 3 г "

VAR41="Индекс Homo исходно"

VAR42="Индекс Homo через 3 г "

VAR43="ФСГ исходно"

VAR44="ФСГ через 3 г "

VAR45="ТТГ  исходно"

VAR46="ТТГ через 3 г "

VAR47="Т4 св исходно"

VAR48="Т4 св через 3 г "

VAR49="а/т к ТПО исходно"

VAR50="а/т к ТПО через 3 г "

VAR51="ПРЛ исходно"

VAR52="ПРЛ через 3 г "

VAR53="ингибин исходно"

VAR54="Тестостерон исходно"

VAR55="17-ОП исходно"

VAR56="микроальбуминурия исходно"

VAR57="микроальбуминурия через 3 г "

VAR58="сист.АД исходно"

VAR59="сист.АД через 3 г "

VAR60="диаст.АД исходно"

VAR61="диаст.АД через 3 г "

VAR62="ДЭ исходно"

VAR63="ДЭ через 3 г "

VAR64="Фактор Виллебранда исходно"

VAR65="Фактор Виллебранда через 3 г "

VAR66="тромбоциты исходно"

VAR67="тромбоциты через 3 г "

Зависимым признаком выступал показатель GR="Состояние здоровья пациентов", имеющий 2 уровня: 1="Здоровые", 2="Больные". Ниже приведена одна из оценок уравнения логит-регрессии, которая обеспечивала показатель конкордации равный 99,4%.

 

 

 

            Следующий массив данных был создан исследователем Е.Г. из Кузбасса для изучения процесса реабилитации  при вибрационной болезни. Перечень признаков данного массива приведён ниже.

NUMBER="Номер наблюдения"

DO_POSLE="Период наблюдения"

FIO="ФИО пациента"

VAR1A="Группа"

VAR2="Возраст"

VAR3A="Профессия"

VAR4="Стаж"

VAR5="Тревога"

VAR6="Депрессия"

VAR7="Самочувствие"

VAR8="Активность"

VAR9="Настроение"

VAR10="Сумма"

VAR11="Вегетативные изменения"

VAR12="Шихана"

VAR13A="ШОУ"

VAR14A="Ориентация"

VAR15A="Восприятие"

VAR16A="Внимание"

VAR17A="Память"

VAR18A="Речь,чтение и письмо"

VAR19="Сумма"

VAR20A="Концептуализация"

VAR21A="Беглость речи"

VAR22A="Динамический праксис"

VAR23A="Простая реакция выбора"

VAR24A="Усложненная реакция выбора"

VAR25A="Хватательный рефлекс"

VAR26="Сумма"

VAR27="Прямой балл"

VAR28="Обратный балл"

VAR29="Таблица№1"

VAR30="Таблица №2"

VAR31="Таблица №3"

VAR32="Таблица №4"

VAR33="Таблица №5"

VAR34A="Тест рисования часов"

VAR35="А1"

VAR36="Е1"

VAR37="А2"

VAR38="Е2"

VAR39="А3"

VAR40="Е3"

VAR41A="Память на образы"

VAR42A="1"

VAR43A="2"

VAR44A="3"

VAR45A="4"

VAR46A="5"

VAR47A="Шкала Хачинского"

VAR48="КИМ ОСА"

VAR49="D ОСА"

VAR50="V ОСА"

VAR51="RI ОСА"

VAR52="D ПРГ ОСА"

VAR53="V ПРГ ОСА"

VAR54="RI ПРГ ОСА"

VAR55="D ПА"

VAR56="V ПА"

VAR57="RI ПА"

VAR58="D ПРГ ПА"

VAR59="V ПРГ ПА"

VAR60="RI ПРГ ПА"

VAR61="V ПМА"

VAR62="RI ПМА"

VAR63="V ПРГ ПМА"

VAR64="RI ПРГ ПМА"

VAR65="РИ FMпр"

VAR66="РИ FM лев"

VAR67="ППСС FM пр"

VAR68="ППСС FM лев"

VAR69="ДСИ FM пр"

VAR70="ДСИ FM лев"

VAR71="МУ FM пр"

VAR72="МУ FM лев"

VAR73="ПЭС FM пр"

VAR74="ПЭС FM лев"

VAR75="ВБКН FM пр"

VAR76="ВБКН FM лев"

VAR77="ВМКН FM пр"

VAR78="ВМКН FM лев"

VAR79="ДДИ FM ПР"

VAR80="ДДИ FM лев"

VAR81="И FM пр"

VAR82="И FM лев"

VAR83="ВРПВ FM пр"

VAR84="ВРПВ FM лев"

VAR85="ИВО FM пр"

VAR86="ИВО FM лев"

VAR87="РИ ОМ пр"

VAR88="РИ ОМ лев"

VAR89="ППСС ОМ пр"

VAR90="ППСС ОМ лев"

VAR91="ДСИ ОМ пр"

VAR92="ДСИ ОМ лев"

VAR93="МУ ОМ пр"

VAR94="МУ ОМ лев"

VAR95="ПЭС ОМ пр"

VAR96="ПЭС ОМ лев"

VAR97="ВБКН ОМ пр"

VAR98="ВБКН ОМ лев"

VAR99="ВМКН ОМ пр"

VAR100="ВМКН ОМ лев"

VAR101="ДДИ ОМ пр"

VAR102="ДДИ ОМ лев"

VAR103="И ОМ пр"

VAR104="И ОМ лев"

VAR105="ВРПВ пр."

VAR106="ВРПВ лев."

VAR107="ИВО ОМ пр"

VAR108="ИВО ОМ лев"

VAR109="Амплитуда альфа"

VAR110="Мощность Альфа"

VAR111="Индекс Альфа"

VAR112="Амплитуда Вета"

VAR113="Мощность Бета"

VAR114="Индекс Вета"

VAR115="Амплитуда Тета"

VAR116="Мощность Тета"

VAR117="Индекс Тета"

VAR118="Амплитуда Дельта"

VAR119="Мощность Дельта"

VAR120="Индекс Дельта"

VAR121="O2-A2 D1"

VAR122="O1-A1 D1"

VAR123="P4-A2 D1"

VAR124="P3-A1 D1"

VAR125="C4-A2 D1"

VAR126="C3-A1 D1"

VAR127="F4-A2 D1"

VAR128="F3-A1 D1"

VAR129="Fp2-A2 D1"

VAR130="Fp1-A1 D1"

VAR131="T6-A2 D1"

VAR132="T5-A1 D1"

VAR133="T4-A2 D1"

VAR134="T3-A1 D1"

VAR135="F8-A2 D1"

VAR136="F7-A1 D1"

VAR137="Pz-A1 D1"

VAR138="Cz-A2 D1"

VAR139="Fz-A1 D1"

VAR140="Сумма D1"

VAR141="O2-A2 D2"

VAR142="O1-A1 D2"

VAR143="P4-A2 D2"

VAR144="P3-A1 D2"

VAR145="C4-A2 D2"

VAR146="C3-A1 D2"

VAR147="F4-A2 D2"

VAR148="F3-A1 D2"

VAR149="Fp2-A2 D2"

VAR150="Fp1-A1 D2"

VAR151="T6-A2 D2"

VAR152="T5-A1 D2"

VAR153="T4-A2 D2"

VAR154="T3-A1 D2"

VAR155="F8-A2 D2"

VAR156="F7-A1 D2"

VAR157="Pz-A1 D2"

VAR158="Cz-A2 D2"

VAR159="Fz-A1D2"

VAR160="Сумма D2"

VAR161="Fp1-P2 D1"

VAR162="F7-F8 D1"

VAR163="F3-F4 D1"

VAR164="T3-T4 D1"

VAR165="C3-C4 D1"

VAR166="T5-T6 D1"

VAR167="P3-P4 D1"

VAR168="O1-O2 D1"

VAR169="Fp1-Fp2 D2"

VAR170="F7-F8 D2"

VAR171="F3-F4 D2"

VAR172="T3-T4 D2"

VAR173="C3-C4 D2"

VAR174="T5-T6 D2"

VAR175="P3-P4 D2"

VAR176="O1-O2 D2"

VAR177="М:латентность-1"

VAR178="М6 латентность-2"

VAR179="М:длительность-1"

VAR180="М: лительность-2"

VAR181="М: амплитуда-1"

VAR182="М: амплитуда-2"

VAR183="М: площадь-1"

VAR184="М: площадь-2"

VAR185="М: расстояние"

VAR186="М: время"

VAR187=" М: скорость"

VAR188="М: резидуальная латентность"

VAR189=" У:латентность-1"

VAR190="У: латентность-2"

VAR191="У: длительность-1"

VAR192="У: длительность-2"

VAR193="У: амплитуда-1"

VAR194="У: амплитуда-2"

VAR195="У: площадь-1"

VAR196="У: площадь-2"

VAR197="У: расстояние"

VAR198="У: время"

VAR199="У: скорость"

VAR200="У: резидуальная латентность"

VAR201="М.с.: латентность"

VAR202="М.с.:длительность"

VAR203="М.с.: амплитуда"

VAR204="М.с.: площадь"

VAR205="М.с.: расстояние"

VAR206="М.с.: время"

VAR207="М.с.: скорость"

VAR208="У.с.: латентность"

VAR209="У.с.: длительность"

VAR210="У.с.: амплитуда"

VAR211="У.с.: площадь"

VAR212="У.с.: расстояние"

VAR213="У.с.: время"

VAR214="У.с.: скорость"

 

В данном исследовании одной из зависимых переменных выступал признак DO_POSLE="Период наблюдения", имеющий 2 градации: «До лечения», и «После лечения». Ниже приведена одна из оценок уравнения логит-регрессии, которая обеспечивала показатель конкордации равный 99,1%.

 

 

            Массив, созданный исследователем И.С. из Барнаула для изучения влияния метаболических показателей, показателей дисфункции эндотелия и оксидативного стресса лечения, сопутствующих патологии дисфункции левого желудочка сердца, состоял из 246 наблюдений и включал 45 признаков, приведённых ниже.

NUMBER=«Номер наблюдения»

HV=«Вид ХСН и Возрастная группа»

HSN=«Вид ХСН»

VOZR=«Возрастная группа»

VAR1=«ВОЗРАСТ»

VAR2=«ИНДЕКС МАССЫ ТЕЛА»

VAR3=«АД сист»

VAR4=«АД диаст»

VAR5=«мочевая кислота»

VAR6=«индекс НОМА»

VAR7=«гликозилированный гемоглобин»

VAR8=«МАУ»

VAR9=«СРБ»

VAR10=«оксид азота»

VAR11=«МДА»

VAR12=«КАТалаза»

VAR13=«ФНО»

VAR14=«ИЛ-1в»

VAR15=«ИЛ-4»

VAR16=«МНП»

VAR17=«КДР»

VAR18=«ФВ»

VAR19=«IVRT (время изоволюметрического  расслабления)»

VAR20=«E/A»

VAR21=«ММЛЖ»

VAR22=«тест с 6 мин ходьбой»

VAR23=«инсулин»

VAR24=«С пептид»

VAR25=«ЛП»

VAR26A=«Ожирение I ст»

VAR27A=«Ожирение II ст»

VAR28A=«Ожирение III ст»

VAR29A=«Ингибиторы АПФ»

VAR30A=«АРА»

VAR31A=«бета- блокаторы»

VAR32A=«статины»

VAR33A=«дезагрегант»

VAR34A=« индапамид»

VAR35A=« верошпирон»

VAR36A=«фуросемид»

VAR37A=«дигоксин»

VAR38A=«торасемид»

VAR39A=«бронхит»

VAR40A=«зоб»

VAR41A=«патология ЖКТ»

VAR42A=«тромбофлебит»

В данном исследовании одной из зависимых переменных выступал признак HSN=«Вид Хронической Сердечной Недостаточности», имеющий 2 градации: 1="систолическая ХСН" и 2="диастолическая ХСН". Ниже приведено одно из уравнений, полученных для этого массива.

Данное уравнение обеспечивало показатель конкордации равный 98,7%. Как видим, в этом уравнении также имеются два доминирующих предиктора.

Следующий массив был создан исследователем Л.Ч. из Якутска для изучения возможных предикторов исхода внутримозговых гематом по исходным клиническим данным и анамнезу, с целью определения  тактики ведения больного. Этот массив содержал 45 признаков, которые приведены ниже.

NUMBER=«Номер наблюдения»

VAR1A="локализация"

VAR2="возраст"

VAR3A="пол"

VAR4A="перенесённое ОНМК"

VAR5A="артериальная гипертония"

VAR6="АД сист заболевания"

VAR7="АД диас заболевания"

VAR8="эритроциты"

VAR9="гемоглобин"

VAR10="лейкоциты"

VAR11="общий белок"

VAR12="альбумин"

VAR13="билирубин"

VAR14="АЛАТ"

VAR15="АСАТ"

VAR16="СОЭ"

VAR17="мочевина"

VAR18="ПТИ"

VAR19="глюкоза"

VAR20A="сахарный диабет"

VAR21="холестерин"

VAR22A="курение"

VAR23A="злоупотребление алкоголем"

VAR24A="наследственность ССЗ"

VAR25A="наследственность по инсульту"

VAR26="число серд.сокр."

VAR27A="гипертрофия лев.жел."

VAR28A="фибрилляция предсердий"

VAR29A="инфаркт в анамнезе"

VAR30="балл шкалы Глазго"

VAR31A="цефалгия"

VAR32A="рвота"

VAR33A="эписиндром"

VAR34A="глазодвигательные нарушения"

VAR35A="тип гематомы"

VAR36="объём гематомы"

VAR37A="интравентрикулярный прорыв"

VAR38A="острая окклюз. гидроцефалия"

VAR39A="субарахноидальное кровоизл."

VAR40A="нейровиз.перенес.ОНМК"

VAR41A="дисц.энцефалопатия"

VAR42A="результат лечения"

VAR43= "балл шкалы Скан1"

VAR44="балл шкалы NIH1"

VAR45A="исход лечения"

 

Зависимыми признаками выступали показатели VAR42A="результат лечения" (4 градации: 1="удовлетв", 2="средн", 3="тяжел", 4="летальн") и VAR45A="исход лечения" (2 уровня: 1="Пациент выжил", 2="Пациент умер"). Для признака VAR42A="исход лечения" показатель конкордации был в интервале 90-94%, а для признака VAR45A="исход лечения"  в интервале 98,7 – 99,7%.

 

Перечень таких примеров можно было бы продолжить ещё не одним десятком массивов и сотнями анализируемых в них признаков. И для всех этих задач общим был единый подход: предварительный анализ всех возможных парных связей между признаками, что позволяло при оценке уравнений логистической регрессии оптимизировать алгоритмы и наборы предикторов таким образом, что показатель конкордации увеличивался от исходных значений равных 60-70%, до конечных значений равных 90-95% и выше.


Далее: 4. Логистическая регрессия и ROC-анализ.

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Уважаемые читатели! Благодаря усилиям зарубежных коллег, начиная с марта 2017 г. стоимость выполнения заказов по стат. анализу массивов данных сократилась, по сравнению с 2016 г., на 25-30%.

Отзывы заказчиков по статистическому анализу данных

«Роющая деятельность кабана». Статья в "Независимой" газете...

Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Такими новыми сравнениями являются проверки равенства дисперсий, коэффициентов корреляции, коэффициентов регрессии или векторов групповых средних, сравнение групп многомерными методами, и т.д. В статье объяснена большая ценность обнаружения не нормального распределения признака. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками. Что является важнейшим аргументом по формулировке списка проверки взаимосвязей важнейших признаков проводимого исследования. Специфика других сравнений хорошо иллюстрируется различными графиками, а также наличием списка литературы из 98 книг и статей, полезных для этой тематики. Причём более половины из них имеют ссылки на доступные в интернете данные издания. По традиции очередной годовщины нашего сайта, в две последние статьи размещены ещё и иные весьма полезные ссылки..


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.


23 примера оформления данных, их описания и описания целей исследования


В ноябре 2013 года сайту БИОМЕТРИКА исполнилось 16 лет. А что было раньше? И что теперь?


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.



М.И. Антоненко
 
ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.


Долгое прощание
с
лысенковщиной 

История науки не ограничивается перечислением успешных исследований. Она должна сказать нам о безуспешных исследованиях и объяснить, почему некоторые из самых способных людей не могли найти ключа знания, и как репутация других дала лишь большую опору ошибкам, в которые они впали.

Дж. Максвелл 

 

Функциональный кризис отечественной науки, переживаемый в последнее десятилетие, вынуждает беспристрастно анализировать основные причины этого явления [1-2, 45-47]. Последние результаты библиометрического анализа говорят о том, что вклад России в мировую науку по основным направлениям составляет уже порядка 5-8% [1-2]. По данным того же источника вклад США составляет 32-41%. 

Коммунистическая идеология, уродовавшая многие направления отечественной науки на потребу вождей, породила и такое явление, как лысенковщина. Для большинства читателей фамилия Лысенко ассоциируется с августовской сессией ВАСХНИЛ 1948 г. и разгромом генетики. Однако лысенковщину нельзя сводить только к запрету на генетику. Достигнув своего апогея в середине текущего века, и став воистину периодом средневековья в отечественной биологии и медицине, лысенковщина изуродовала и методологию этих наук, изгнав из них в частности математику, и в первую очередь статистику. Последствия этого уродства и по сей день не позволяют биологии и медицине приблизиться к статусу точных наук. В статье описаны основные этапы этого явления и особенности методологии применения статистики в биологии и медицине, полученные автором при анализе нескольких сот диссертаций и монографий а также более 1500 статей в области экспериментальной биомедицины. 

Ключевые слова: лысенковщина, биология, медицина, статистика, биостатистика, методологический кризис. 


Автор понимает, что поднятая им проблема достаточно обширна и не может быть полностью освещена в одной статье, содержащей лишь малую часть материалов готовящейся к изданию монографии, посвященной проблемам применения статистики в медицине и биологии. Автор будет признателен читателям, которые выскажут свой взгляд на эту проблему, а также смогут дополнить авторские материалы новыми примерами.  Обсуждаемая в данной статье проблема может быть решена только общими усилиями всех заинтересованных в этом специалистов.

Работая над этой статьей, мне довелось несколько раз встречаться с одним из ректоров медицинского вуза. Обсуждая с ним предлагаемые в статье меры, направленные на исправление этого неприглядного положения, я с изумлением услышал от него такой ответ: "Как ученый - я "За", а как ректор - "Против"! И если так мыслит и говорит ректор, доктор медицинских наук, член-корреспондент РАМН, то несложно понять отношение к этой проблеме рядовых сотрудников такого вуза. Не потому ли многие из них представлены в разделе КУНСТКАМЕРА, вместе с моим собеседником, своими диссертациями и статьями...

За те несколько лет, что прошли с момента публикации этой статьи, а также статей  "В новый век - с доказательной биомедициной"(ПОИСК, N 20 (522) 21 мая 1999) и "Куплю 500 диссертаций! (Медицинская Газета N10 за 14.02.2001)", практически ничего не изменилось. Да, в России стали писать и говорить о доказательной медицине, проводить конференции по этой тематике, а в некоторых медицинских вузах даже открыли центры доказательной медицины. Однако откроем биомедицинские журналы и диссертации, и станет ясно, что это не более чем дань моде... 

 

Материалы по науковедению

В новый век - с доказательной биомедициной



1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"