Яндекс.Метрика

Логистическая регрессия в медицине

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят.
 
Пишите нам на адрес

Выбрав любое изображение, кликните по нему мышкой, и Вы прочитаете о том, как ...

Редактор БИОМЕТРИКИ
В. Леонов

Яндекс
цитирования
Яндекс цитирования
 
25 наиболее популярных ссылок, посещаемых нашими читателями
http://www.biometrica.tomsk.ru/Leonov_Erevan_2015.pdf
http://www.biometrica.tomsk.ru/erevan_8.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/UNESCO%202010.pdf
http://www.biometrica.tomsk.ru/zakaz.htm
http://www.biometrica.tomsk.ru/zakaz_28.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/STAT_CARDIO_2014.pdf
http://www.biometrica.tomsk.ru/logit_9.htm
http://www.biometrica.tomsk.ru/stat_cardio7.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/zakaz_19.htm
http://www.biometrica.tomsk.ru/lis.htm
http://www.biometrica.tomsk.ru/kamchat.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/zakaz_15.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )



  Отзывы заказчиков по статистическому анализу данных

Логистическая регрессия в медицине и биологии

В. Леонов

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5. Особенности логистической регрессии в акушерстве.
6. Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество уравнений логистической регрессии.


В данной серии статей, на уровне доступном для начинающих, рассмотрены основы логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Объяснено, что методу присуща множественность решений, что позволяет выбирать для использования в реальной врачебной практике наиболее удобные и надёжные тактики лечения. Рассмотрено использование метода к массивам данных, содержащим несколько сотен признаков. Показано, что корректное создание таких массивов и их анализ возможны лишь при участии биостатистиков на самых первых этапах таких исследований. Рассмотрена связь логистической регрессии и ROC-анализа. Приведены многочисленные уравнения логистической регрессии и ROC-кривые, полученные при анализе реальных данных. Объяснена целесообразность использования вместе с методом логистической регрессии набора методов анализа парных взаимосвязей между различными признаками, а также использование более сложных методов многомерной статистики.
Логистическая регрессия. Анализ массивов большой размерности.

Научное изучение всех явлений,
касающихся здорового и больного
человека, есть та база, на которой
основываются все достижения
клинической медицины,
как медицины научной.
____________
В.И. Глинчиков

 

Наиболее интересны, и в то же время наиболее сложны и трудоёмки, оценки уравнений логистической регрессии для массивов большой размерности, т.е. для данных, содержащих по несколько сотен переменных. С двумя примерами анализа таких объёмных матриц можно познакомиться в статьях «Логистическая регрессия в анализе связи артериальной гипертонии и психических расстройств». Н.П.Гарганеева, В.П.Леонов. Сибирский медицинский журнал, № 3-4, 2001, с.42-48.  (http://www.biometrica.tomsk.ru/lib/psycho3.htm ) и «Артериальная гипертония как психосоматическая проблема». Н.П. Гарганеева, Ф.Ф. Тетенев, В.Я. Семке, В.П. Леонов. Клиническая медицина, № 1, 2004, с. 35-41 (http://www.biometrica.tomsk.ru/lib/psycho2.htm ).

Рассмотрим несколько таких массивов и обсудим специфику работы с ними. Первый массив, созданный Евдокимовой Т.А. при изучении аллергии, содержит более 1200 наблюдений и более 400 признаков. Ниже приведён перечень этих признаков.

NUMBER="Номер наблюдения"

VAR1A="проблемы при употребл. молока"

VAR2A="избегаете употреб. молока из-за ПА"

VAR3A="Как часто употребляете молоко"

VAR4A="Проблемы при употреблении яиц"

VAR5A="Избегаете употреб. яиц из-за ПА?"

VAR6A="как часто едите яйца?"

VAR7A="Проблемы из-за рыбы?"

VAR8A="избегаете употребления рыбы?"

VAR9A="как часто едите рыбу?"

VAR10A="ПА на креветки?"

VAR11A="Избегаете употребления из-за ПА?"

VAR12A="как часто едите креветок?"

VAR13A="ПА на моллюсков?"

VAR14A="Избегаете их употребление?"

VAR15A="как часто едите моллюсков?"

VAR16A="ПА на арахис?"

VAR17A="избегаете употребление арахиса"

VAR18A="как часто едите арахис?"

VAR19A="ПА на фундук?"

VAR20A="Избегаете употребления фундука?"

VAR21A="Как часто едите фундук?"

VAR22A="ПА на грецкий орех?"

VAR23A="избегаете употребления?"

VAR24A="как часто едите грецкий орех?"

VAR25A="ПА на шоколад?"

VAR26A="избегаете употребления шоколада?"

VAR27A="Как часто едите шоколад?"

VAR28A="ПА на персики?"

VAR29A="Избегаете употреблять?"

VAR30A="Как часто едите?"

VAR31A="ПА на яблоки?"

VAR32A="избегаете употребления яблок"

VAR32A="Как часто едите яблоки?"

VAR34A="ПА на киви?"

VAR35A="Избегаете употреблять киви?"

VAR36A="Как часто едите?"

VAR37A="ПА на Бананы?"

VAR38A="Избегаете употребления бананов"

VAR39A="Как часто едите бананы?"

VAR40A="ПА на дыню?"

VAR41A="Избегаете употребления дыни?"

VAR42A="Как часто едите дыню?"

VAR43A="ПА на клубнику?"

VAR44A="Избегаете употребление клубники"

VAR45A="Как часто едите клубнику?"

VAR46A="ПА на апельсин?"

VAR47A="Избегаете употребления апельсина?"

VAR48A="Как часто едите апельсин?'

VAR49A="ПА на помидор?"

VAR50A="Избегаете употребления помидоров?"

VAR51A="Как часто едите помидоры?"

VAR52A="ПА на морковь?"

VAR53A="Избегаете употр.моркови?"

VAR54A="Как часто едите морковь?"

VAR55A="ПА на сою?"

VAR56A="Избегаете употребления сои?"

VAR57A="Как часто едите сою?"

VAR58A="ПА на пшеницу?"

VAR59A="Избегаете употреб.пшеницы?"

VAR60A="Как часто едите пшеницу?"

VAR61A="ПА на гречку?"

VAR62A="Избегаете употреб.гречки?"

VAR63A="Как часто едите гречку?"

VAR64A="ПА на кукурузу?"

VAR65A="Избегаете употрукурузы?"

VAR66A="Как часто едите кукурузу?"

VAR67A="ПА на рис?"

VAR68A="Избегаете употребиса?"

VAR69A="Как часто употребис?"

VAR70A="ПА на горчицу?"

VAR71A="Избегаете употреборчицы?"

VAR72A="Как часто едите горчицу?"

VAR73A="ПА на подсолнечник?"

VAR74A="Избегаете употреб.подсолн?"

VAR75A="Как часто употреб.подсолн."

VAR76A="Реакции при употреблении др.пищ.прод."

VAR77A="продукт, код"

VAR78A="продукт, код"

VAR79A="продукт, код"

VAR80A="какой из продызывал больше проблем?"

VAR81="Возр.появл.первых симпт.на этот продукт"

VAR82="Возр,появл.симпт на прод в послед. раз?"

VAR83A="Как часто была ПА после употребл.прод?"

VAR84A="Избегсть прод.после возникн.симпт?"

VAR85A="Отмеч.при употр.прод.припухл.во рту?"

VAR86A="покраснение или зуд кожи?"

VAR87A="диаррея или рвота?"

VAR88A="насморк или заложенность носа?"

VAR89A="покрасненаздраж.глаз или слезотеч."

VAR90A="затрудненным глотанием?"

VAR91A="одышкой?"

VAR92A="скованностью в суставах?"

VAR93A="обмороком или головлкружением?"

VAR94A="головной болью?"

VAR95A="Другие симптомы?"

VAR96A="симптомы"

VAR98="Ч-з какое вр.посл.еды появл.сим-мы,мин?"

VAR99="дни"

VAR100="как долго это продолжалось, минуты?"

VAR101="Часы?"

VAR102="Дни?"

VAR103A="Проводилось ли лечение?"

VAR104A="лекарство 1, код"

VAR105A="лекарство 2, код"

VAR106A="лекарство 3, код"

VAR107A="Говорил врач, что у ребенка ПА?"

VAR108A="Получ.реб.первые два года вит?"

VAR109A="Пьет ли ребенок молоко?"

VAR110A="ест ребенок масло или маргарин?"

VAR111A="Отмечрипы,свист в теч посл. 12 мес"

VAR112A="была ли одышка во время хрипов?"

VAR113A="Отмечрипы,свист, когда реб.неболел"

VAR114A="была у ребенка астма?"

VAR115="Возрогда отмеч.перв приступ астмы?"

VAR116A="был приступ астмы за посл.12 мес?"

VAR117A="ск-ко за посл.12 мес.просып от астмы?"

VAR118A="были ли у ребенка симптомы ринита?"

VAR119="Возр. появил.первых симп-в ринита?"

VAR120A="были сим-ы заложе.носа, в отсутРЗ?"

VAR121A="Отмечим-мы АР в теч.посл.12 мес?"

VAR122A="Сопровожд.ли симптР раздраж.глаз?"

VAR123A="Была ли сыпь в течение 6 мес?"

VAR124="Ско-ко лет реб.огда появилась сыпь?"

VAR125A="сыпьокализ.в локтевых сгибах?"

VAR126A="сыпь локализ.под коленями?"

VAR127A="сыпь локализпереди лодыжек?"

VAR128A="сыпь локализокруг шеи?"

VAR129A="сыпь локализокруг ушей?"

VAR130A="сыпь локализокруг глаз?"

VAR131A="была ли сыпь за последние 12 мес?"

VAR132A="была ли экзема?"

VAR133A="При контакте с живот.появл.кашель?"

VAR134A="при контакте с жив.появл.хрипы?"

VAR135A="при конт жив.чувств.тяж.в груди?"

VAR136A="при конт жив.затрудне.дыхания?"

VAR137A="при конт жив.чих.или залож.носа?"

VAR138A="при конт жив.-раздраж.глаз"

VAR139A="При конт пыльцой, появл.кашель?"

VAR140A="при конт.с пыльцой появлрипы?"

VAR141A="при конт. с пыльц.-тяж.в груди?"

VAR142A="при конт пыльц.-затруднен.дых."

VAR143A="при конт пыльц.-чих.,залож.носа?"

VAR144A="при конт пыльц.-раздраж.глаз?"

VAR145A="получал ли ребенок СИТ?"

VAR146A="СИТ пыльцой?"

VAR147A="СИТ клещем домашней пыли?"

VAR148A="Была рвота несвяз отравл в теч.посл.6 мес?"

 

VAR149A="тошнота?"

VAR150A="жжение или боль в середине груди"

VAR151A="кислый вкус во рту"

VAR152A="принимал ребнтирефл.преп.в теч.посл.6 мес"

VAR153="Ско-ко лет матери, когда она родила реб"

VAR154="на каком сроке береможден ребенок"

VAR155="рост при рождении"

VAR156="вес при рождении"

VAR157A="ск-ко раз в теч 2 лет реб переезжал"

VAR158A="мать употребл алког. во вререм."

VAR159A="Как часто мать принимала алкоголь"

VAR160A="кури ли мать во время беремен."

VAR161="сколько сигарет в день?"

VAR162A="Получал ребенок грудное вскармл?"

VAR163="кагда перестали кормить грудьюни"

VAR164="отнт груди, недели?"

VAR165="отнт груди, месяцы?"

VAR166A="ребенок ел молочмеси?"

VAR167="когда впервые получил смесьни"

VAR168="получил смесь, недели?"

VAR169="получил смесь, месяцы?"

VAR170="Когда прекращено кормлмесью,дни"

VAR171="прекращормл., недели"

VAR172="прекращормл., месяцы?"

VAR173A="Смесь на основе коровьего молока?"

VAR174A="смесь на основе соевого молока?"

VAR175A="гипоаллергенная смесь?"

VAR176="дополнидкость реб.дали в,нед"

VAR177="Когда ввели прикормедели"

VAR178A="была у ребнф.дых.путей до 2 лет"

VAR179A="Госпитало 2 лет с забол.легких?"

VAR180A="получал антиб первые 2 года жизни"

VAR181="сколько братьев и систер?"

VAR182="сколько старших братьев и сестер?"

VAR183="сколько младших?"

VAR184="у скольких братьев-сестер была астма?"

VAR185="у скольких братьев-сестер были др. АЗ"

VAR186="ск-ко детей спали в детской первые 2 г."

VAR187A="старшие дети спали с этим ребенком?"

VAR188A="ходил в д.со старшими дет.до 2 лет"

VAR189="когда пошел в садик?"

VAR190A="где чаще всего жил ребенок до 2 лет"

VAR191A="дома была кошка в первые 2 г.ж."

VAR192A="дома была Собака в первые 2 г.ж."

VAR193A="дома были Лошади в перв.2 г.ж.?"

VAR194A="дома были птицы в перв. 2 г.ж.?"

VAR195A="морские св др.пушис.животные?"

VAR196A="другие"

VAR197A="В настоящее время в доме есть кошка?"

VAR198A="в доме есть Собака?"

VAR199A="в доме есть лошади?"

VAR200A="в доме есть птицы?"

VAR201A="в доме есть кролики?"

VAR202A="в доме есть мыши?"

VAR203A="в доме есть морсквин.и др.?"

VAR204A="другие?"

VAR205A="как часто реб.присут.при приготовл.пищи"

VAR206A="была у матери когда-нибудь ПА?"

VAR207A="Была у матери астма?"

VAR208A="Экзема или кожная аллергия?"

VAR209A="был у матери Алинит?"

VAR210A="какой у матери образов, Неполн.ср."

VAR211A="у матери србразов?"

VAR212A="у матери высш. образов."

VAR213A="мать работает в настоящее время?"

VAR214A="мать связана с пищ.прод?"

VAR215A="мать работала в латексных перч.?"

VAR216A="Перчатки были напудрены тальком?"

VAR217A="Мать курила после рождения реб."

VAR218A="мать курила, когда был рожден реб."

VAR219="Число сигарет в день"

VAR220="Ск-ко лет реб. когда мать снова закур?"

VAR221="Сколько сигарет в день?"

VAR222="Как много мать курит сейчас? В день"

VAR223A="Бросила курить?"

VAR224="Ск-ко лет реб, когда мать бросила курить?"

VAR225="Ск-ко чел. курили в доме в первые 2 г.ж.?"

VAR226="ск-ко час реб. наход. в накур.помещ.-2г.ж."

VAR227="Ск-ко чел. регул. курят сейчас?"

VAR228="Ск-ко час в день ребах-ся в накур.пом?"

VAR229A="Была ли у отца ПА?"

VAR230A="была у отца астма?"

VAR231A="была у отца экзема или дерматит?"

VAR232A="Был у отца  ал. ринит?"

VAR233A="какое образов. у отца? Неполное ср."

VAR234A="полное среднее?"

VAR235A="высшее образование?"

VAR236A="Отец работает в настоящее время?"

VAR237A="Была у него раб. связан. с перера.прод.пит?"

VAR238A="работал отец в латексных перчатках?"

VAR239A="перчатки пудрили тальком?"

VAR240A="отец курил после рождения ребенка?"

VAR241A="Отец курил, когда ребенок был рожден?"

VAR242="сколько сигарет в день?"

VAR243="ск-ко лет реб., когда отец снова закурил?"

VAR244="число сигарет в день?"

VAR245="ск-ко отец курит сейчасигарет в день?"

VAR246A="Бросил курить?"

VAR247="ск-ко лет было реб. когда отец бросил кур."

VAR248="вес"

VAR249="рост"

VAR250="Сриам.кжн.проб береза"

VAR251="Сриам.кжн.проб горчица"

VAR252="Сриам.кжн.проб молоко"

VAR253="Сриам.кжн.проб яйцо"

VAR254="Сриам.кжн.проб соя"

VAR255="Сриам.кжн.проб рыба"

VAR256="Сриам.кжн.проб лесн.орех"

VAR257="Сриам.кжн.проб дыня"

VAR258="Сриам.кжн.проб пшеница"

VAR259="Сриам.кжн.проб томат"

VAR260="Сриам.кжн.проб финики"

VAR261="Сриам.кжн.проб гистамин"

VAR262="Сриам.кжн.проб контроль"

VAR263="Сриам.кжн.проб арахис"

VAR264="Сриам.кжн.проб марь"

VAR265="Сриам.кжн.проб амброзия"

VAR266="Сриам.кжн.проб подсолнух"

VAR267="Сриам.кжн.проб сев.яблоко"

VAR268="Сриам.кжн.проб морковь"

VAR269="Сриам.кжн.проб яблоко юж."

VAR270A="ПА выявла скрин.или клинич.иссл.?"

VAR271A="после серологссл.выявлена ПА"

VAR272A="ПА на яйца в анамнезе"

VAR273=" IG E яйцо, значение"

VAR274A="ПА на молоко в анамнезе"

VAR275="IG E молоко, значение"

VAR276A="ПА на рыбу"

VAR277="IG E к рыбе"

VAR278A="ПА на креветки в анамнезе"

VAR279="IG E на креветки"

VAR280A="ПА на арахис в анамнезе"

VAR281="IG E к арахису"

VAR282A="ПА на фундук в анамнезе"

VAR283="IG E к фундуку"

VAR284A="ПА на яблоки в анамнезе"

VAR285="IG E к яблоку"

VAR286A="ПА на персик в анамнезе"

VAR287="IG E к персику"

VAR288A="ПА на сельдерей в анамнезе"

VAR289="IG E к сельдерею"

VAR290A="ПА на киви в анамнезе"

VAR291="IG E к киви"

VAR292A="ПА на горчицу в анамнезе"

VAR293="IG E  горчице"

VAR294A="ПА на кунжут в анамнезе"

VAR295="IG E к кунжуту"

VAR296A="Па на сою в анамнезе"

VAR297="IG E к сое "

VAR298A="ПА на грецкий орех"

VAR299="IG E к грецкреху"

VAR300A="ПА на пшеницу"

VAR301="IG E к пшенице"

VAR302A="Па на гречневую крупу"

VAR303="IG E к гречке"

VAR304A="ПА на морковь в анмнезе"

VAR305="IG E к моркови"

VAR306A="ПА на томаты в анамнезе"

VAR307="IG E к томатам"

VAR308A="ПА на бананы в анамнезе"

VAR309="IG E к бананам"

VAR310A="ПА к чечевице в анамнезе"

VAR311="IG E к чечевице"

VAR312A="ПА на подсолн. в анамнезе"

VAR313="IG E к подсолн."

VAR314A="ПА на дыню в анамнезе"

VAR315="IG E к дыне"

VAR316A="ПА на зерно в анамнезе"

VAR317="IG E к зерну"

VAR318A="ПА на мак в анамнезе"

VAR319="IG E к маку"

VAR320="IgE к травам"

VAR321="IgE к березе"

VAR322="Общий IG E"

VAR323="Ig E к крапиве"

VAR324="Ig E к полыни"

VAR325="Ig E к рису"

VAR326A="полеролог.на к-л приор.прод"

VAR327A="Полеролог.на к-л приор.прод.1 гр"

VAR328A="полер.на прод.1гр,искл.мол.и яйцо"

VAR329A="пола пищпродукты гр.2"

VAR330A="полеролог.на пищпродукты гр.3"

VAR331A="к любому пищпродсключ.мол.и яйца"

VAR332A="позитивная серология на яйца"

VAR333A="позитивная серология на молоко"

VAR334A="позитивная серология на рыбу"

VAR335A="позитивная серология на креветки"

VAR336A="позитивная серология на арахис"

VAR337A="позитивная серология на фундук"

VAR338A="позитивная серология на яблоко"

VAR339A="позитивная серология на персик"

VAR340A="позитивная серология на сельдерей"

VAR341A="позитивная серология на киви"

VAR342A="позитивная серология на горчицу"

VAR343A="позитивная серология на кунжут"

VAR344A="позитивная серология на сою"

VAR345A="позитивная серология на грецкрех"

VAR346A="позитивная серология на пшеницу"

VAR347A="позитивная серология на гречку"

VAR348A="позитивная серология на морковь"

VAR349A="позитивная серология на томат"

VAR350A="позитивная серология на банан"

VAR351A="позитивная серология на чечевицу"

VAR352A="позитивная серология на подсолн."

VAR353A="позитивная серология на дыню"

VAR354A="позитивная серология на зерно"

VAR355A="позитивная серология на мак"

VAR356A="позитивная серология на рис"

VAR357A="ПА на любые не уточненрехи"

VAR358A="ПА на к-л приор.прод. 1гр в анамнезе"

VAR359A="Положнамн.на прод. 1гр,кр.мол.и яйца"

VAR360A="ПА в анамнезе на приор.прод. 2 гр"

VAR361A="ПА в анамнезе на приор.прод. 3 гр"

VAR362A="ПА в анамна несколько приорпрод."

VAR363A="несколько продсключая молоко и яйцо"

VAR364A="полнамн.и пол.серол.к приорпрод"

VAR365A="место жительства ребенка"

VAR366="стрелки подсол.Hel a 2 S alb"

VAR367="стрелок подсолн. Hel a 3"

VAR368="стрелки Латекс Hev b 8_cal"

VAR369="стрелок Гр.орех Jug r 2"

VAR370="стрелок гр.ореха Jug r 4"

VAR371="стрелок Томат Lyc e 3"

VAR372="стрелок Яблоко Mal d 1"

VAR373="стрелок яблока Mal d 2"

VAR374="стрелок яблока Mal d 3"

VAR375="стрелок яблока Mal d 4 "

VAR376="стрелок Креветка Pen a 1"

VAR377="стрелок Тимофе. Phl p 5"

VAR378="стрелок тимоф Phl p 6"

VAR379="стрелок тимоф Phl p 7"

VAR380="стрелок Киви Act d 1"

VAR381="стрелок Ананас Ana c 2"

VAR382="стрелок Молоко Bos d 4"

VAR383="стрелок молоко Bos d 4_cal"

VAR384="стрелок молоко Bos d 5"

VAR385="стрелок молоко Bos d 8"

VAR386="стрелок молоко Caphcasein"

VAR387="стрелок Фундук Cor a 1.04.01"

VAR388="стрелок фундук Cor a 11"

VAR389="стрелок фундук Cor a 2"

VAR390="стрелок фундук Cor a 8"

VAR391="стрелок фундук Cor a 9"

VAR392="стрелок Карп Cyp c 1"

VAR393="стрелок Морковь Dau c 4"

VAR394="стрелок морковь Dau c 1.02.01"

VAR395="стрелок морковь Dau c 1.01.03"

VAR396="стрелок Персик Pru p 1"

VAR397="стрелок персик Pru p 3"

VAR398="стр.белок Кунжут Ses i 1"

VAR399="стр.белок кунжут Ses i 2"

VAR400="стр.белок кунжут Ses i 3"

VAR401="стр.белок Горчица Sin a 1"

VAR402="стр.белок Пшеница Tri a 12"

VAR403="стр.белок пшеница Tri a 19.01.01"

VAR404="стр.белок пшеница Tri a gliadin"

VAR405="стрелок пшеница Треска Gad m 1"

VAR406="стрелок Яйцо Gal d 1"

VAR407="стр.белок яйцо Gal d 1_cal"

VAR408="стр.белок яйца Gal d 2"

VAR409="стр.белок яйца Gal d 2_cal"

VAR410="стр.белок яйца Gal d 3"

VAR411="стр.белок яйца Gal d 3_cal"

VAR412="стр.белок яйца Gal d 4"

VAR413="стр.белок яйца Gal d 5"

VAR414="стр.белок Соя Gly m 4"

VAR415="стр.белок соя Gly m 6"

VAR416="стр.белок соя Gly m 5"

VAR417="стр.белок Сельдерей Api g 1.01"

VAR418="стр.белок сельдерей Api g 1_cal"

VAR419="стр.белок сельдерей Api g 4"

VAR420="стр.белок сельдерей Api g 5"

VAR421="стр.белок арахиса Ara h 1_heat"

VAR422="стр.белок арахиса Ara h 1_nat"

VAR423="стр.белок арахиса Ara h 1"

VAR424="стр.белок арахиса Ara h 2.6"

VAR425="стр.белок арахиса Ara h 2.6_heat"

VAR426="стр.белок арахиса Ara h 3.4"

VAR427="стр.белок арахиса Ara h 8"

VAR428="стрелок береза Bet v 1"

VAR429="стрелок береза Bet v 2_cal"

VAR430A="ПОЛ респонд"

VAR431A="коды места жительства респонд"

 

Как видим, примерно половина признаков являются качественными, другая половина – количественными. Тактика анализа таких массивов данных определяется целями исследования и тем, каким образом предполагаются использовать полученные в исследовании результаты. Обычно такие полноценные массивы данных бывают «долгоиграющими», т.е. используемыми не только для разового анализа с целью защиты докторской или кандидатской диссертации, а подвергаются статистическому анализу многократно в течение нескольких лет с помощью различных методов. Это вызывается тем, что по мере получения результатов анализа таких массивов, возникает желание проверить новые гипотезы изучаемых механизмов развития и течения того или иного заболевания, уточнить ряд деталей, которые первоначально казались несущественными, разработать несложный алгоритм практического использования полученной модели и т.д. И это абсолютно верная и правильная тактика работы с подобными массивами. Поскольку такие массивы данных содержат огромные объёмы информации, которые извлекаются из них путём последовательного применения различных методов анализа. Типичным примером такого исследования является всемирно известное Фремингемское исследование - Framingham Heart Study.

Обычно программы работы по анализу подобных массивов данных включают порядка 50-100 пунктов. Предварительный анализ описанного выше массива по аллергии позволил получить для зависимых признаков VAR1A="проблемы при употребл. молока" и VAR4A="Проблемы при употреблении яиц" порядка десятка уравнений, с величиной показателя конкордации в интервале 85-95%.

Как уже говорилось выше, принципиальное отличие многомерных методов от других методов анализа заключается в использовании информации о взаимных связях анализируемых признаков. Предположим, что из представленных выше признаков наибольший интерес представляют 200 количественных признаков, и 210 дискретных, качественных признаков.  Из них 10 качественных признаков будем считать выходными, для которых необходимо оценить уравнения логистической регрессии. Для упрощения обозначим дискретные, качественные признаки буквой D, и далее номер по порядку, например, D1, D2, …, D200. Количественные же признаки обозначим аналогичным образом через К1, К2, …, К200. А зависимые качественные признаки обозначим как Z1, Z2, …, Z10.

В этом случае для каждого зависимого признака Zj можно использовать в качестве потенциальных предикторов самые разные наборы исходных переменных. Например, только 200 качественных переменных. Или же только 200 количественных признаков. Или все качественные и все количественные признаки. Однако в любом случае для понимания и интерпретации, получаемых при этом уравнений, необходимо изучить все парные взаимосвязи. Причём такое изучение не должно ограничиваться только анализом тех пар, в которых в качестве одного члена такой пары обязательно присутствует зависимый признак. Поскольку включение предикторов в уравнение базируется не только на использовании значимых связей между зависимой переменной и одной качественной или количественной, но и на использовании парных связей между отдельными качественными и отдельными количественными предикторами.

Применительно к нашему случаю это означает, что не следует ограничиваться только анализом связи между 200 парами качественных признаков вида Z1 – D1, Z1 – D2, …, Z1 – D200, или вида  Z1 – K1, Z1 – K2, …, Z1 – K200. Но необходимо также исследовать все парные связи вида DiDj,  KiKj, KiDj. Оценим для данного набора количество подобных парных связей, которые необходимо проанализировать. Начнём с дискретных качественных признаков. Для 200 качественных признаков число анализируемых пар составит 200*(200-1)/2=100*199=19900. Такое же число парных связей будет и для количественных показателей. Сюда же следует для каждой зависимой переменной Zi добавить ещё 400 парных связей вида ZiDj и ZiKj.

Отметим, что такой анализ, помимо его важности для интерпретации логистических моделей, имеет ещё и собственную колоссальную важность, поскольку он даёт огромное количество ценной информации о наличии или отсутствии взаимосвязей внутри многих пар признаков. Эта информация позволят более полно и осмысленно представить всю картину изучаемого явления. Для иллюстрации описанных выше оценок рассмотрим пример, в котором использованы всего лишь 7 потенциальных предикторов и одна зависимая переменная. Предположим, что исходя из результатов ранее выполненных исследований, модель изучаемого процесса может быть представлена в виде одной зависимой переменной Z, а также двух уровней потенциальных предикторов. В первом уровне имеется 4 предиктора (2 количественных – К1 и К2, и 2 дискретных – D1 и D2). Во втором уровне имеется 3 потенциальных предиктора (2 количественных – К3 и К4, и 1 дискретный – D3).

Рис. 2 Схема парных связей между предикторами и зависимой переменной

На рис. 2 стрелками представлены возможные парные связи между этими признаками. Число парных связей внутри 1-го уровня равно [4*(4-1)/2]=6. Число парных связей внутри 2-го уровня равно [3*(3-1)/2]=3. Число парных связей между 1 и 2 уровнями равно 4*3=12. И число парных связей между зависимой переменной Z и предикторами 1 и 2 уровней равно соответственно 4 и 3. Итого мы имеем 28 парных связей. Эту же самую оценку можно получить и иным способом: 8*(8-1)/2= 28, (где 8 – общее число анализируемых признаков). Несложно аналогичным образом подсчитать число тройных связей, в каждой из которых обязательно должен присутствовать зависимый признак Z.

Почему необходим анализ всех этих парных связей? Современные алгоритмы оценки уравнения логистической регрессии используют наиболее продуктивные пошаговые процедуры. При этом на каждом шаге такой процедуры может включаться один предиктор. Включение такого предиктора не обязательно может быть обусловлено наличием связи между зависимой переменной Z с этим предиктором, а наличием значимых связей между предикторами уже включёнными в уравнение, и предикторами-кандидатами на включение. Тщательный анализ шагов позволяет оптимизировать состав предикторов, добиваясь этим повышения качества модели, в частности, путём максимизации такого показателя, как процент конкордации.

При создании таких серьёзных массивов данных обязательно необходимо участие в их разработке профессиональных биостатистиков, причём уже на самых первых этапах формирования признакового пространства, а также формирования числа градаций качественных признаков. В качестве примера игнорирования этого требования приведу фрагменты недавней переписки.

31 мая 2011 г. я получил письмо следующего содержания.

«Уважаемый Василий Петрович!

Я пишу Вам по совету профессора А.М. Чернявского из НИИ Патологии Кровообращения имени Е.Н. Мешалкина г. Новосибирск. В нашем институте три недели назад официально начато Российское рандомизированное многоцентровое клиническое исследование влияния различных методов хирургической коррекции ишемической митральной недостаточности в сочетании с коронарным шунтированием на течение сердечной недостаточности и состоятельности коррекции митрального клапана. Это исследование официально зарегистрировано  на сайте www.clinicaltrials.gov, как "ХИРУРГИЧЕСКОЕ ЛЕЧЕНИЕ ИШЕМИЧЕСКОЙ МИТРАЛЬНОЙ НЕДОСТАТОЧНОСТИ" (Surgical Treatment of Ischemic Mitral rEgurgitation – “TIME”). Это большое исследование, рассчитанное на три года, в которое уже на начальном этапе согласились войти и начали работать по общему протоколу кардиохирургические центры  Екатеринбурга, Иркутска, Красноярска, Кишинёва, Москвы, Перми. Создана база больных, в которую вносятся данные из всех центров. В базе более 900 (!) переменных. В дальнейшем мы планируем обратиться к Вам для профессионального статистического анализа полученных данных. Но сейчас, пока работа по набору материала только началась, мы просим Вас, как большого профессионала в данной области, дать некоторые советы по возможному изменению базы данных и количества пациентов, которые будут принимать участие в данном исследовании.  В прикреплённых файлах Вы найдёте протокол исследования и базу данных. Заранее благодарен, если Вы найдёте время помочь нам!

С уважением, Рузматов Тимур»

Вместе с приведённым выше письмом автор прислал документ из 8 страниц, озаглавленный как «Протокол российского клинического многоцентрового исследования». В разделе 1.5 этого документа, сообщалось следующее. «Четыреста двадцать (420) пациентов мужского и женского пола в возрасте от 30 до 75 лет с клиническим диагнозом … , которым планируется  … , будут включены в исследование и получат … лечение». Внимательное изучение этого документа не привело к обнаружению хоть каких-то намёков на то, какие же конкретно гипотезы и какими статистическими методами организаторы этого исследования планируют проверять. А ведь именно для этого в медицинской науке и создаются подобные базы данных.

Из переписки с Т. Рузматовым выяснилось, что при организации данного исследования и формировании базы данных биостатистик не привлекался. Более того, при организации этого масштабного, и без сомнения необходимого многоцентрового исследования, руководители исследования вообще не запланировали этап статистического анализа этой базы данных и, соответственно, его финансирование. Такое отношение организаторов исследования к создаваемой базе данных не может не удручать. Фактически это означает, что затратив миллионы рублей на создание этой базы данных, из неё будет извлечена лишь самая примитивная информация. Причём ещё неизвестно, насколько корректно это будет сделано. Можно сказать, что такое формирование подобных баз данных есть наглядная иллюстрация подхода «Давай, Давай, – Потом Подумаем» и неуважения к биостатистике и к тем, кто занимается этой наукой (см. наши статьи «Общие проблемы применения статистики в биомедицине или что разумнее: ДДПП или ДППД?» URL:http://www.biometrica.tomsk.ru/problem.htm и «Искушение Знанием или  Сколько стоит биометрика?» URL:http://www.biometrica.tomsk.ru/price_biom.htm).

Обстоятельства сложились так, что в начале 2011 г. автор этих срок некоторое время находился в этом самом НИИ. Будучи там я предложил зам. директора НИИ по науке профессору А.М. Ч. прочитать для сотрудников этого НИИ лекцию о современных возможностях биостатистики и типичных ошибках её использования в медицинской науке. Увы, оказалось, что лекция не нужна. Как не нужно и предложенное статистическое рецензирование статей в издаваемом в этом НИИ журнале. И это при том, что в этих статьях, и в диссертациях, защищаемых сотрудниками этого НИИ, те же самые ошибки, что и в кузбасских публикациях (http://www.biometrica.tomsk.ru/kuzbass1.htm ). О чём говорит такое отношение руководителей медицинской науки к биостатистике? Как минимум, об отсутствии у них знаний об эффективности современных методов биостатистики. И, соответственно, неэффективности создания подобных баз данных и их дальнейшего анализа без участия биостатистиков. В результате наша переписка с Т. Рузматовым закончилась тем, что я порекомендовал убедить руководителя этого исследования привлекать профессиональных биостатистиков ещё на этапе планирования подобных исследований, и увеличить объём базы данных в несколько раз. Ответа на эти предложения я не получил…

Для демонстрации неэффективности работы с базами данных, в которых количество признаков превышает объём наблюдений, рассмотрим следующий пример, построенный на реальной базе данных, подобной той, которую планируют создать организаторы упомянутого выше исследования.  

Ниже приведены признаки проанализированной базы данных, созданной исследователем Н.С. из Якутска при исследовании проблем в области акушерства.

NUMBER=«Номер наблюдения»

GRUPPA =«Группа: опытная и контроль»

VAR1 =«Возраст матери»

VAR2A =«Возраст матери группированный

VAR3 =«Возраст отца»

VAR4A =«Возраст отца группированный» 

VAR5A =«Исход»

VAR6 =«Койко-дней»

VAR7A =«Национальность»

VAR8 =«Беременность по счету»

VAR9A =«Течение первой половины беременности»

VAR10A =«Течение второй половины беременности»

VAR11A =«Анемия во время беременности»

VAR12A =«Хронический пиелонефрит»

VAR13A =«Ожирение»

VAR14 =«Роды»

VAR15A =«Течение родов»

VAR16A =«Исп-ние анальгезии и анестезии в родах»

VAR17A =«Медицинский аборт»

VAR18A =«Самопроизвольный выкидыш»

VAR19A =«Группа крови матери»

VAR20A =«Резус-фактор матери»

VAR21 =«Масса при рождении»

VAR22A =«Масса при рождении группированная»

VAR23 =«Рост»

VAR24 =«Срок родоразрешения» (недель)

VAR25A =«Предлежание»

VAR26A =«Пол»

VAR27A =«Состояние при рождении»

VAR28 =«Апгар на 1 мин»

VAR29 =«Апгар на 5 мин»

VAR30A =«Вскармливание»

VAR31 =«Убыль массы (%)»

VAR32A =«Состояние в отделении»

VAR33 =«Общий анализ крови Le»

VAR34 =«Общий анализ крови Er»

VAR35 =«Общий анализ крови Ht»

VAR36 =«Сахар крови, минимальное значение»

VAR37A =«Продолжительность гипогликемии (сут)»

VAR38A =«Время появления гипогликемии (сут.)»

VAR39A =«Метод коррекции гипогликемии»

VAR40A =«Тяжесть гипогликемии»

VAR41A =«Адекватность коррекции»

VAR42A =«Наличие симптоматики гипогликемии»

VAR43 =«Профиль угнетение-возбуждение»

VAR44A =«Изменение нейросонографии 12 градаций»

VAR45A =«Изменение нейросонографии 4 градации»

VAR46 =«Общий белок»

VAR47 =«Общий билирубин»

VAR48A =«Аллергологический статус»

VAR49A =«Соматический статус»

VAR50A =«Тяжесть неврологических проявлений»

VAR51A =«Неврологический статус – катамнез»

VAR52 =«Возраст постановки диагноза»

VAR53 =«Общая сфера»

VAR54 =«Общая сфера округлённая»

VAR55 =«Ориентир в месте времени и личных данных»

VAR56 =«Критичность»

VAR57 =«Адекватность поведения»

VAR58 =«Внимание»

VAR59 =«Корректурная проба»

VAR60 =«Наложенные и перечеркнутые предметы»

VAR61 =«Нахождение отличий между картинками»

VAR62 =«Исследование движений и действий»

VAR63 =«Мелкая моторика»

VAR64 =«Оральный праксис»

VAR65 =«Координация»

VAR66 =«Копирование»

VAR67 =«Гнозис»

VAR69 =«Акустический гнозис»

VAR70 =«Ориентирование простых фигур»

VAR71 =«Идентификация эмоций»

VAR72 =«Речь»

VAR73 =«Спонтанная речь»

VAR74 =«Проба на называние»

VAR75 =«Проба на понимание»

VAR76 =«Память»

VAR77 =«Слухоречевая память»

VAR78 =«Двигательная память»

VAR79 =«Зрительная память»

VAR80 =«Запоминание рассказа»

VAR81 =«Мышление»

VAR82 =«Понимание смысла рассказа»

VAR83 =«Выведение аналогий»

VAR84 =«Исключение понятий»

VAR85 =«Логическая задача»

VAR86 =«Воображение»

VAR87 =«Тест с геометрическими фигурами»

VAR88 = "Закончи рисунок"

VAR89 =«Такого не бывает»

VAR90 =«Общая оценка»

VAR91A =«Нейропсихологическое заключение»

VAR92A =«Посещение детского сада»

VAR93A =«Занятия с психологом»

VAR94A =«Занятия с логопедом»

VAR95 =«Возраст тестирования»

VAR96A =«Соотв-ие реч развития эпикризному сроку»

VAR97A =«Простая дислалия»

VAR98A =«Сложная дислалия»

VAR99A =«Стертая дизартрия»

VAR100A =«Заикание»

VAR101A =«Задержка речевого развития»

VAR102A =«Алалический синдром со стертой дизартрией»

VAR103A =«Нал-е указ-я в диагне на гипогликемию»

В качестве зависимого признака выступает переменная VAR15A =«Течение родов», имеющая три  градации:  1 - самопроизвольные,  2 - программированные,  3 – оперативные. Из исходного массива данных путём случайного отбора (равномерный закон распределения) отбиралось 10 подмассивов, объёмы которых были в 2 раза меньше, чем количество переменных. После чего по этим подмассивам оценивались 10 уравнений логистической регрессии. Сравнение 10 полученных уравнений показало различие их структуры. В частности, наблюдалось отличие уравнений  по составу предикторов. Помимо этого, в тех уравнениях, в которых были одинаковые предикторы, в большинстве случаев различались знаки коэффициентов для одних и тех же предикторов. В то же время для всех уравнений значения показателя конкордации были весьма велики, от 95 до 99%.

   Далее производилась следующая процедура. В каждый подмассив данных после оценки уравнений, добавлялось по 5 наблюдений, случайно выбранных из основного массива,  затем по этому дополненному массиву вновь производилась оценка уравнения. Далее из такого  дополненного массива удалялись 5 случайно выбранных наблюдений. В результате объём подмассива вновь возвращался к исходному. И вновь производилась оценка уравнений логистической регрессии.

Что же показали эти эксперименты? Они показали, что оценки уравнений, полученных по массивам столь малых объёмов, весьма неустойчивы. Т.е. в уравнениях, получаемых после добавления и удаления 5 наблюдений, не обнаруживается воспроизводимости состава набора предикторов. Применяя полученные таким образом уравнения для прогноза, используя для этой цели наблюдения, не входившие в подмассив по которому оценивали параметры уравнения, были получены показатели конкордации равные примерно 33%, а не 95-99%. Т.е. фактически наблюдалось равномерное случайное распределение этих наблюдений в три подгруппы зависимой переменной.  

            Все эти результаты говорят о том, что число наблюдений, число анализируемых переменных и число градаций дискретных признаков должны определяться заранее ещё на этапе разработки программы подобных исследований. Для чего и требуется участие в этом процессе профессионального биостатистика.  

            Следующий массив, созданный кардиологом О.П., включает более 300 признаков.

VAR1=«Дата рождения»

VAR2=«Дата госпитализации»

VAR3=«Дата выписки»

VAR4A=«Смерть в период настоящей госпитализации»

VAR5A=«Образование»

VAR6A=«Характер труда»

VAR7=«Возраст»

VAR8A=«Пол»

VAR9=«Рост»

VAR10=«Вес»

VAR11=«ИМТ»

VAR12=«ЛПИ»

VAR13=«ОТ»

VAR14=«ОБ»

VAR15A=«Инфаркт миокарда в прошлом»

VAR16A=«Стенокардия в анамнезе»

VAR17A=«ХСН в анамнезе»

VAR18A=«Инсульт/ТИА в анамнезе»

VAR19A=«Заболевания  периферических артерий»

VAR20A=«Хроническая почечная недостаточность»

VAR21A=«Чрезкожные коронарные вмешательства»

VAR22A=«Коронарное шунтирование»

VAR23A=«Коронарные стенозы > 50%»

VAR24A=«Мерц. аритмия»

VAR25A=«Курение»

VAR26A=«Сахарный диабет»

VAR27A=«Впервые выявленный СД»

VAR28A=«НТГ»

VAR29A=«Артериальная гипертензия»

VAR30A=«Гипер-холестеринемия»

VAR31А=«Семейный анамнез ИБС»

VAR32=«Сист.АД»при поступлении

VAR33=«Диаст.АД»при поступл

VAR34=«ЧСС»при поступл

VAR35A=«одышка на день исслед»

VAR36A=«Класс Killip»

VAR37A=«РИТМ ЭКГ»

VAR38A=«Блокады»

VAR39A=«ЖТ/ФЖ»

VAR40A=«ST»

VAR41A=«Основн. локализац. изм-ний на ЭКГ»

VAR42A=«глубина ИМ»

VAR43A=«Блокада ЛНПГ»

VAR44A=«Тип стресс-теста»

VAR45A=«Результат стресс теста»

VAR46А=«ТФН»

VAR47=«левая ВСА» 

VAR48=«правая ВСА»

VAR49=«левая ОСА»  

VAR50=«правая ОСА»

VAR51=«левая ПА»

VAR52=«правая ПА»

VAR53=«Толщина КИМ»

VAR54А=«Градация КИМ»

VAR55=«Креатинин (при поступлении)»

VAR56=«Глюкоза (при поступлении)»

VAR57=«Глюкоза натощак»

VAR58=«Общий холестерин»       

VAR59=«ЛПНП»

VAR60=«ЛПВП»

VAR61=«Триглицериды»

VAR62=«Лейкоциты (при поступлении)»

VAR63=«минимальное значение лейкоцитов»

VAR64=«Гемоглобин (при поступлении)»

VAR65=«Гематокрит (при поступлении)»

VAR66=«Эритроциты (при поступлении)»

VAR67=«Тромбоциты (при поступлении)»

VAR68=«Общая КФК (при поступлении)»

VAR69=«Общая КФК (максимальное значение)»

VAR70=«МВ-КФК (при поступлении)»

VAR71=«МВ-КФК (максимальное значение)»

VAR72=«Тропонин Т (при поступлении)»

VAR73=«Тропонин Т (максимальное значение)»

VAR74А=«ХСН на день исслед»

VAR75А=«КАГ»

VAR76А=«Стеноз ≥50% ствола ЛКА»

VAR77А=«Стеноз ≥50% ПНА»

VAR78А=«Стеноз ≥50% ОА»

VAR79А=«Стеноз ≥50% ПКА»

VAR80А=«Стеноз ≥50% ДВ»

VAR81А=«Стеноз ≥50% ВТК»

VAR82А=«Стеноз ≥50% шунта»

VAR83А=«ЧКВ»

VAR86A=«Число сосудов с БАП»

VAR87A=«Тромбоз стента имплант наст госпитал»

VAR88A=«Показано ЧКВ на другом сегменте»

VAR89A=«ТЛТ»

VAR90A=«Препарат для ТЛТ»

VAR91A=«Эффективность тромболизиса»

VAR92А»=доАспирин»

VAR93А=«доКлопидогрель»

VAR94А=«до Варфарин»

VAR95А=«доВ-блокаторы»

VAR96А=«до Ингибиторы АПФ»

VAR97А=«до БРАТ II «

VAR98А=«до Блок Са каналов (дигидропирид)»

VAR99А=«до Блок Са каналов (недигидропирид)»

VAR100А=«до Дигоксин»

VAR101А=«до Петлевые диуретики»

VAR102А=«до Тиазидные диуретики»

VAR103А=«до Спиронолактон»

VAR104А=«до Нитраты»

VAR105А=«до Статины»

VAR106А=«до Кордарон»

VAR107А=«до Инсулин»

VAR108А=«до Метформин»

VAR109А=«до Другие СМ»

VAR110А=«до Другие ССП»

VAR111А=«Нагрузочная доза аспирина»

VAR112А=«Аспирин в стационаре»

VAR113А=«Нагрузочная доза клопидогреля»

VAR114А=«Клопидогрель в стационаре»

VAR115А=«Варфарин»

VAR116А=«НФГ догоспитально»

VAR117А=«НФГ в/в в первые 24 часа»

VAR118А=«НФГ п/к»

VAR119А=«Ингибиторы GP IIb/IIIa рец»

VAR120А=«НМГ догоспитально»

VAR121А=«НМГ»

VAR122А=«Фондапаринукс»

VAR123А=«Бета-блокаторы»

VAR124А=«Ингибиторы АПФ»

VAR125А=«БРАТ II»

VAR126А=«Блок Са каналов (дигидропиридин)»

VAR127А=«Блок Са каналов (недигидропиридин)»

VAR128А=«Дигоксин»

VAR129А=«Петлевые диуретики»

VAR130А=«Тиазидные диуретики»

VAR131А=«Спиронолактон»

VAR132А=«Нитраты»

VAR133А=«Статины»

VAR134А=«Кордарон»

VAR135А=«Инсулин»

VAR136А=«Метформин»

VAR137А=«Другие СМ»

VAR138А=«Другие ССП»

VAR139А=«СТАЦ  Аспирин»

VAR140А=«СТАЦ  Клопидогрель»

VAR141А=«СТАЦ  Варфарин»

VAR142А=«СТАЦ  НФГ в/в»

VAR143А=«СТАЦ  НФГ п/к»

VAR144А=«СТАЦ  Ингиб GP IIb/IIIa рец»

VAR145А=«СТАЦ  НМГ»

VAR146А=«СТАЦ  Фондапаринукс»

VAR147А=«СТАЦ  Бета-блокаторы»

VAR148А=«СТАЦ  Ингибиторы АПФ»

VAR149А=«СТАЦ  БРАТ II»

VAR150А=«СТАЦ  Блок Са каналов (дигидропирид)»

VAR151А=«СТАЦ  Блок Са каналов (недигидропир)»

VAR152А=«СТАЦ  Дигоксин»

VAR153А=«СТАЦ  Петлевые диуретики»

VAR154А=«СТАЦ  Тиазидные диуретики»

VAR155А=«СТАЦ  Спиронолактон»

VAR156А=«СТАЦ  Нитраты»

VAR157А=«СТАЦ  Статины»

VAR158А=«СТАЦ  Кордарон»

VAR159А=«СТАЦ  Инсулин»

VAR160А=«СТАЦ  Метформин»

VAR161А=«СТАЦ  Другие СМ»

VAR162А=«СТАЦ  Другие ССП»

VAR163А=«Впервые выявленный СД»

VAR164А=«ранняя постинфаркт стенокардия»

VAR165А=«рецидив инфаркта миокарда»

VAR166А=«Дата и время рецидива»

VAR167А=«развитие ишемического инсульта»

VAR168А=«развитие геморрагич.  инсульта (ГИ)»

VAR169А=«развитие ТИА»

VAR170А=«Остановка сердца»

VAR171А=«Дата и время остановки сердца»

VAR172А=«Механические осложнения»

VAR173А=«Развития тампонады сердца»

VAR174А=«Дата и время тампонады»

VAR175А=«Перфорация при ЧТКА или КАГ»

VAR176А=«Тромбоэмболические осложнения»

VAR177А=«Развития кардиогенного шока»

VAR178А=«Дата и время развития КШ»

VAR179А=«Развитие отёка легких»

VAR180=«Дата и время разв-я отёка лёгких»

VAR181А=«опасные нарушения ритма и проводимости»

VAR182А=«Смерть за время госпитализации»

VAR183=«Дата и время смерти»

VAR184А=«Причина смерти»

VAR185А=«Исход»

VAR186=«Количество дней в стационаре»

VAR187А=«Окончательный диагноз»

VAR188А=«Выполнялось вскрытие»

VAR189А=«Совпадение диагнозов»

VAR190=«Сегмент №1»

VAR191=«Сегмент №2»

VAR192=«Сегмент №3»

VAR193=«Сегмент №»4

VAR194=«Сегмент №5»

VAR195=«Сегмент №6»

VAR196=«Сегмент №7»

VAR197=«Сегмент №8»

VAR198=«Сегмент №9»

VAR199=«Сегмент №10»

VAR200=«Сегмент №11»

VAR201=«Сегмент №12»

VAR202=«Сегмент №13»

VAR203=«Сегмент №14»

VAR204=«Сегмент №15»

VAR205=«Нв на день исслед»

VAR206=«P O2»

VAR207=«P CO2»

VAR208=«PH»

VAR209=«Sp O2»

VAR210=«Sp O2 на день исслед»

VAR211=«ЖЕЛ(FVC).  Литры»

VAR212=«% должЖЕЛ»

VAR213А=«градация ЖЕЛ»

VAR214=«ОФВ1(FEV1), литры»

VAR215=«% должОФВ1»

VAR216А=«градация ОФВ1»

VAR217=«ОФВ1/ФЖЕЛ (FEV1/FVC), % факт»

VAR218А=«градация инд Тиффно»

VAR219=«МОС 25% (FEF), литры»

VAR220=«% долж МОС 25%»

VAR221А=«градация МОС 25%»

VAR222=«МОС 75% (FEF), литры»

VAR223=«% долж МОС 75%»

VAR224А=«градация МОС 75%»

VAR225=«МОС 25-75% (FEF), литры»

VAR226=«% МОС 25-75%»

VAR227А=«градация МОС 25-75%»

VAR228=«ПСВ (FEF) Max, литры»

VAR229=«% ПСВ(FEF)»

VAR230А=«градация ПСВ»

VAR231=«FIVC, литры»

VAR232=«FIF Max, литры»

VAR233АТип вентиляции»

VAR234=«ЖЕЛ (SVC),л»

VAR235=«% ЖЕЛ»

VAR236А=«градация   ЖЕЛ»

VAR237=«ЁЛ (IC),л»

VAR238=«%ЕЛ»

VAR239А=«градация   ЕЛ»

VAR240=«РОВыд (ERV),л»

VAR241=«%РОВыд»

VAR242А=«градация РОВыд»

VAR243=«ВГО (TGV), л»

VAR244=«% ВГО»

VAR245А=«градация ВГО»

VAR246=«ООЛ(RV), л»

VAR247=«% ООЛ(RV)»

VAR248А=«градация ООЛ»

VAR249=« ОЕЛ (TLC), л»

VAR250=«% ОЕЛ(TLC)»

VAR251А=«градация ОЕЛ»

VAR252=«RV/TLC, % фактич»

VAR254А=«градация RV/TLC»

VAR255=«DLCOunc»

VAR256=«% DLCOunc»

VAR257=«DLCOcor»

VAR258=«% DLCOcor»

VAR259А=«степень снижения DLCOcor»

VAR260=«DL/VA»

VAR261=«% DL/VA»

VAR262А=«градация DL/VA»

VAR263=«VA»

VAR264=«% VA»

VAR265Аградация VA»

VAR266=«Raw»

VAR267=«% Raw»

VAR268Аградация Raw»

 VAR269=«Gaw»

VAR270=«% Gaw»

VAR271Аградация Gaw»

VAR272=«sRaw»

VAR273А=«градация sRaw»

VAR274=«sGaw»

VAR275=«% sGaw»

VAR276А=«градация sGaw»

VAR277=«КДР ЛЖ, СМ»

VAR278А=«КДР шифр»

VAR279=«КДО ЛЖ, МЛ»

VAR280А=«КДО шифр»

VAR281=«КСР ЛЖ, СМ»

VAR282А=«КСР шифр»

VAR283=«КСО ЛЖ, МЛ»

VAR284А=«КСО шифр»

VAR285=«ЛП, СМ»

VAR286А=«ЛП шифр»

VAR287А=«ПП шифр»

VAR288=«ПЖ (см)»

VAR289А=«ПЖ шифр»

VAR290=«МЖП, СМ»

VAR291=«ЗСЛЖ, СМ»

VAR292А=«наличие ГЛЖ»

VAR293=«ПРЛЖд»

VAR294=«ПРЛЖс»

VAR295=«ИОТ»

VAR296А=«ИОТ шифр»

VAR297А=«тип ремоделирования миокарда»

VAR298=«ИСC»

VAR299А=«ИСС шифр»

VAR300=«ИСИР»

VAR301=«ФВ(ТЕЙХОЛЬЦ)»

VAR302А=«уровень снижения ФВ»

VAR303=«КОРЕНЬ АО, СМ»

VAR304=«ВОСХ АО, СМ»

VAR305А=«МК-РЕГ»

VAR306=«ПИК Е»

VAR307=«ПИК А»

VAR308=«Е\А»

VAR309=«DT»

VAR310=«ВИР»

VAR311А=«Диаст. Дисфункция»

VAR312А=«АК-РЕГ»

VAR313А=«ТК-РЕГ»

VAR314=«СДЛА»

VAR315А=«Степень гипертензии»

VAR316=«УО»

VAR317А=«УО шивр»

VAR318=«УИ»

VAR319А=«УИ шифр»

VAR320=«Площадь поверхности тела»

VAR321=«КДИ»

VAR322А=«КДИ шифр»

VAR323=«КСИ»

VAR324А=«КСИ шифр»

VAR325=«ММЛЖ»

VAR326А=«ММЛЖ шифр»

VAR327=«ИММЛЖ»

VAR328А=«ИММЛЖ шифр»

VAR329А=«Острая аневризма ЛЖ»

VAR330А=«Тромб в полости ЛЖ»

VAR331А=«Нарушения локальной сократимости»

VAR332А=«Дисфункция папиллярных мышц»

Среди многих задач по анализу этого массива, одной из наиболее интересных была задача оценки уравнения логит-регрессии для признака VAR4A=«Смерть в период настоящей госпитализации». Данный признак имеет 2 градации: 1='нет', 2='да'. Для этого признака было получено несколько десятков уравнений, которые обеспечивали показатель конкордации в интервале 80-99%.

При оценке уравнений логит-регрессии по массивам с большим списком потенциальных предикторов, имеется возможность оценки столь же большого набора таких уравнений. Это обусловлено тем, что состав потенциальных предикторов можно целенаправленно регулировать. Для этого можно вначале оценить все парные связи между зависимым признаком и всеми остальными потенциальными предикторами. Далее отобрать в качестве потенциальных предикторов только те признаки, которые имеют статистически значимые связи с зависимым показателем.  Другой подход к формированию списка потенциальных предикторов связан с возможностями реального изменения значений предикторов, вошедших в уравнение для целенаправленного увеличения вероятности нужного исхода. Например, в данном массиве таким исходом для признака VAR4A=«Смерть в период настоящей госпитализации» будет исход «нет». 

Следующий подход к выбору списка потенциальных предикторов заключается в последовательном отборе предикторов ранее вошедших в уравнение логит-регрессии, и при этом имеющих максимальные значения модулей стандартизованных коэффициентов регрессии. Не меньшую важность имеет и тактика окончательного отбора наиболее интересных уравнений логит-регрессии из некоторого набора таких уравнений. Напомним, что каждое уравнение позволяет вычислить вероятности отнесения всех  наблюдений в отдельные подгруппы зависимого признака. При этом наблюдение относится в ту подгруппу, для которой вероятность, вычисленная по уравнению, максимальна.

Рассмотрим случай бинарной логит-регрессии, обозначив вероятность отнесения наблюдения к первой подгруппе через р1, а ко второй подгруппе – р2. Для некоторого наблюдения получены две вероятности:  р1=0,4461 ; р2=0,5539. В этом случае наблюдение будет отнесено ко второй подгруппе. Однако это же решение будет принято и для другого случая:  р1=0,0461 ; р2=0,9539. Очевидно, что во втором случае решение об отнесении данного наблюдения ко второй подгруппе более надёжно, нежели в первом случае. Имея в своём распоряжении вычисленные вероятности отнесения к обеим подгруппам для разных вариантов уравнений, несложно оценить средние вероятности отнесения к каждой подгруппе. Далее провести сравнение этих средних для одной и тоже подгруппы, но полученные по разным уравнениям. Далее можно сравнить дисперсии этих оценок и т.д. Т.е. вычисленные вероятности могут быть использованы для сравнения уравнений между собой и выбора более привлекательных уравнений.


Далее: 3. Логистическая регрессия. Примеры анализа реальных данных.

23 примера оформления данных, их описания и описания целей исследования.

Уважаемые читатели! Благодаря усилиям зарубежных коллег, начиная с марта 2017 г. стоимость выполнения заказов по стат. анализу массивов данных сократилась, по сравнению с 2016 г., на 25-30%.

«Роющая деятельность кабана». Статья в "Независимой" газете...

Сравниваем средние, а также и ... В. Леонов

Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа
Д.С. Симанков. Применение метода логистической регрессии для факторов риска, влияющих на исход операции в условиях искусственного кровообращения

В.В. Половинкин ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева
ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко
  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская
"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Н.П. Гарганеева КЛИНИКО-ПАТОГЕНЕТИЧЕСКИЕ ЗАКОНОМЕРНОСТИ ФОРМИРОВАНИЯ ПСИХОСОМАТИЧЕСКИХ СООТНОШЕНИЙ ПРИ ЗАБОЛЕВАНИЯХ ВНУТРЕННИХ ОРГАНОВ И ПОГРАНИЧНЫХ ПСИХИЧЕСКИХ РАССТРОЙСТВАХ  (автореферат диссертации на соискание учёной степени доктора медицинских наук)

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).

А.Н. Рудаков Дифференцированный подход к проведению профилактики язв желудка и двенадцатиперстной кишки у больных ишемической болезнью сердца, принимающих аспирин (автореферат диссертации на соискание учёной степени кандидата медицинских наук) 

Г.Б. Кривулина Влияние велотренировок различной продолжительности на дисфункцию эндотелия и факторы риска атеросклероза у молодых мужчин (автореферат диссертации на соискание учёной степени кандидата медицинских наук) 

Л.В. Сутурина Гипоталамический синдром: основные звенья патогенеза, диагностика, патогенетическая терапия и прогноз (автореферат диссертации на соискание учёной степени доктора медицинских наук)


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с. Актуальность этого издания весьма велика. По-прежнему в биомедицинских статьях и диссертациях публикуется масса статистических нелепостей, как образцы "статистического самоудовлетворения" и "статистического макияжа". Например, в двух диссертациях, выполненных в 2014 и 2015 гг. в Алтайском медуниверситете по разным специальностям, но при этом в полностью идентичных описаниях, состоящих из 94 слов, написано следующее. «Полученные данные были статистически обработаны с использованием программ Microsoft Offis Exel 2007. Достоверность различий между средними величинами определяли с помощью критерия значимости Стьюдента (t). Нормальность распределений в группах оценивали по критерию Шапиро-Уилка». Далее сообщается об использовании критерия Манна-Уитни, и т.д. Очевидно, что под Offis Exel авторы подразумевали Office Excel. Сложнее было бы об этом догадаться, если бы авторы написали Offis Exul. Вывод: оба диссертанта, как и члены двух диссертационных советов, не знают многого, в том числе описанного в этой книге. Например, не знают того, что в пакете Office Excel нет критериев Шапиро-Уилка и Манна-Уитни. Данная книга обучит правильно и хорошо описывать и понимать результаты статистического анализа. Поэтому исследователи станут более качественно выполнять статистический анализ, получая правильную технологию лечения пациентов. Что в результате будет снижать смертность населения, а также себестоимость лечебных процедур.

  Приложение к русскому изданию книги «Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов».
Авторы: Т. А. Ланг, М. Сесик. Перевод с англ. под ред. Леонова В.П. Изд-во:
Практическая Медицина, 2016.
  В приложении приведён список 209 полезных изданий по использованию статистики в биомедицине.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с. Предыдущие издания оригинала этой книги были опубликованы в 2000, 2005 и 2009 гг. Третье издание книги, как и два предыдущих, имеет целью донести до читателя основные понятия и принципы медицинской статистики, которые достаточно широко используются зарубежными медиками и биологами. Книга содержит необходимую теоретическую часть, а также в доступной форме даёт практическое описание того, как могут применяться статистические методы в реальных клинических исследованиях. Низкий уровень использования статистики в отечественной медицинской науке является одной из основных причин, по которым уже 111 лет Нобелевские премии по медицине не присуждаются россиянам. Ценность этой книги для медицинской науки определяется и проводимой в России реформой отечественной науки, в том числе реформой ВАК и системы научной аттестации. Учебное пособие предназначено для студентов, аспирантов и докторантов медицинских вузов, биологических факультетов университетов, врачей, исследователей-клиницистов и всех, кто является сторонником доказательной медицины.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.
Издание представляет собой вводный курс по принципам статистики. Представлены базовые понятия и принципы статистических исследований применительно к медицине. В отличие от большинства подобных изданий, указанные темы изложены кратко и доступно. Для чтения книги не требуется знание сложных разделов высшей математики, вполне достаточно тех, что даются в школе. Внедрение в практику принципов доказательной медицины диктует необходимость понимания статистики. После знакомства с книгой читатель сможет критически оценивать многочисленные публикации, содержащие статистическую терминологию и результаты описанных исследований. Полученные знания помогут избежать ошибок в планировании биомедицинских исследований, а также в изложении их результатов. Большим преимуществом книги служат глоссарий и подробный предметный указатель.
Для студентов, аспирантов, научных работников, а также врачей всех специальностей.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.
Данная книга является наиболее популярным в мире руководством по доказательной медицине, ставшее известным и в России. Руководство предназначено для студентов и врачей. За 18 лет с момента первого издания в 1996 г., эта книга переведена на восемь языков (испанский, итальянский, китайский, немецкий, русский, французский, чешский, японский) и напечатана огромными тиражами. Руководство завоевало признание практикующих врачей, преподавателей и студентов во многих странах; по нему преподается медицина, основанная на доказательствах, в медицинских школах всего мира. В книге 17 глав, среди которых есть и глава "Статистика для неспециалиста". Эта главу мы дополнили большим списком русскоязычной литературы как по самой статистике, так и по биостатистике. А начинается книга с определения понятия "доказательная медицина". Итак, что же такое "доказательная медицина"?
Что, чем, и зачем "доказывают"? Читайте эту книгу!


Логистическая регрессия в медицине и биологии. Леонов В.

В серии из 9 статей рассмотрены основы метода логистической регрессии. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии


Долгое прощание с лысенковщиной

Семинары по биометрике


КУНСТКАМЕРА. Обзор большой коллекции медицинских статей и диссертаций с существенными ошибками и нелепыми использованиями и описаниями методов статистики.

Экспозиция 1
Экспозиция 2
Экспозиция 3
Экспозиция 4

Для удобства работы с экспонатами они отсортированы по фамилиям авторов, городам, в которых проживают авторы, и по организациям, в которых работают авторы, а также по научным специальностям. 

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Сравнительная характеристика показателей кардиореспираторной системы спортсменов и лиц, не занимающихся спортом, в условиях северного промышленного города", Тюменский государственный университет, Тюмень - 2006 г.

Новый экспонат КУНСTКАМЕРЫ - Диссертация «Анализ полиморфизма генов сердечно-сосудистой системы и системы детоксикации в различных возрастных группах Санкт-Петербурга». Обсуждаемая диссертация являет собой ярчайший пример того, какую злую шутку может сыграть с автором игнорирование проблемы множественных сравнений при статистическом анализе полученных данных.

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Оценка проаритмических факторов при постинфарктной систолической дисфункции миокарда и эффективности их фармакологической коррекции", Кемеровская государственная медицинская академия, Кемерово - 2004 г.


Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения. Вот как пишет об этом известный специалист в области прикладной статистики профессор А.И. Орлов в своей книге ЭКОНОМЕТРИКА (Издательство ЭКЗАМЕН, Москва, 2004. - 576 с.). "Приведённые описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений  соответствующих случайных величин. Очевидно, для оправдания или обоснованного изменения существующей практики анализа статистических данных требуется изучить свойства процедур анализа данных при «незаконном» применении. Изучение процедур отбраковки показало, что они крайне неустойчивы к отклонениям от нормальности, а потому применять их для обработки реальных данных нецелесообразно; поэтому нельзя утверждать, что произвольно взятая процедура устойчива к отклонениям от нормальности". Именно Александр Иванович в своём письме от 4 апреля 1998 г. и обратил моё внимание на эту проблему.


Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.

Отзывы читателей обзора "Статистика в кардиологии. 15 лет спустя". В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...


ВАК для учёных? или ВАК для… бумагомарак? «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год. За 2 года, прошедших с момента публикации этой статьи, её прочитали более 29 тысяч читателей.  "Плагиат, обнаруживаемый в диссертациях, это «пена» диссертационного бизнеса. Поскольку в производстве диссертаций «под заказ» гораздо легче просто копировать фрагменты одних диссертаций, вставляя их в очередные заказные диссертации. Производители такого «товара» фабрикуют не только диссертации, но и массу журнальных статей. Основные причины появления этого бизнеса описал профессор Е.В. Балацкий ещё в 2005 г. [1-2], изложив и сценарии его ликвидации. Одной из ключевых причин рождения этого бизнеса являются изменения в Положениях ВАК".

Балацкий Е.В. Диссертационная ловушка


Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА.
КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?
ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ
.
«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».
КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 
ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.
«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН». ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.
КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?
ВМЕСТО ЗАКЛЮЧЕНИЯ.
Весь обзор одним файлом


Отзывы читателей обзора Статистика в кардиологии. 15 лет спустя.

В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения.    

Н. Зорин. "Достоверность" или "статистическая значимость" - 12 лет спустя Изложены последствия неправильного употребления термина "достоверность" в российских медицинских публикациях. Даны рекомендации для исследователей и редакторов медицинских изданий по правильному и наиболее оптимальному употреблению упомянутых терминов и языка контекста.

Н. Зорин. О всё более полном удовлетворении растущих потребностей российского населения в оценке технологий здравоохранения. Часть I. Индустриальная модель медицины. Внедрение технологий. Проблемы терминологии.

Диссертационные войны. Как борьба с плагиатом в диссертациях переместилась из науки в политику

Балацкий Е.В. Диссертационная ловушка

МАТЕМАТИЧЕСКАЯ МОРФОЛОГИЯ.
ЭЛЕКТРОННЫЙ МАТЕМАТИЧЕСКИЙ И МЕДИКО-БИОЛОГИЧЕСКИЙ ЖУРНАЛ

 


1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"