Самоучитель по пакету STATISTICA
Каждый слышит то, что понимает. Гете

Часть учебно-методических материалов сайта, в том числе электронная библиотека, доступны только заказчикам работ по анализу данных для кандидатских и докторских диссертаций, а также слушателям системы дистанционного обучения и консультаций. Запрос на выполнение анализа данных, обучение и консультации направляйте на мэйл E-Mail редактора БИОМЕТРИКИ

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?

Обращение межрегионального Общества специалистов доказательной медицины в ВАК РФ

Дисперсия жизни...
;Регистрационный код (если есть) 
; Открывать в новом окне?  ;Имя нового окна 
; Разрешение (1-8)  ; Скорость смены (1-255)  ; Задержка (миллисекунд)  ; Смена рисунков со спецэффектами ("YES" или "NO")  ;Произвольный рисунок поверх апплета  ;X смещение наложенного рисунка  ;Y смещение наложенного рисунка  ;Задержка освобождения памяти  ;Приоритет задачи (1..10)  ; Мин. время синхр. кадра (мс); Sorry, your browser doesn't support Java ; Сообщение для браузеров без поддержки Java (tm) 

Кликните по фотографии,
и вы сможете ...

Самоучитель по пакету STATISTICA

ГЛАВА 16
Примеры анализа данных в системе STATISTICA

  • Построение плана
  • Задание имени и сохранение экспериментального плана
  • Анализ экспериментальных данных

 

 

В этой главе мы рассмотрим несколько примеров анализа данных с помощью системы STATISTICA. Первый пример относится к области маркетинга (мы показываем возможности модуля Множественная регрессия), три следующие примера к промышленным приложениям (мы показываем возможности модулей Планирование эксперимента и Карты контроля качества), пятый пример иллюстрирует возможности STATISTICA по наложению результатов анализа на географические карты.

Еще раз отметим, что современная STATISTICA — это средство разработки приложений в конкретных областях (бизнесе, медицине, промышленности и др.). Библиотека STATISTICA содержит более 10 000 тщательно отлаженных и проверенных на практике процедур анализа данных. Развитие системы естественно приводит к созданию средств разработки собственного интерфейса и использования библиотеки STATISTICA для создания оригинальных модулей, включающих, наряду с процедурами STATISTICA, алгоритмы разработчика. Все эти процедуры объединяются общим интерфейсом, средствами управления данными и графикой STATISTICA.

Именно в создании средств для разработки приложений мы видим будущее систем анализа данных.

Пример 1

Пример основан на реальных данных, описывающих рынок пива в Греции (см. статью Kioulofas К. Е. «An Application of Multiple Regression Analysis to the Greek Beer Market» в журнале «Journal of Operational Research Society», Vol. 36, № 8, p. 689-696,1985).

Известно, что этот рынок поделен между 5 фирмами, обозначенными далее А, В, С, D и Е. До 1981 года на рынке присутствовали фирмы А, В и С, в 1981 году на рынок пришли фирмы D и Е. Но уже в' 1983 году фирма D не выдержала конкуренции, а у фирмы А возникли финансовые проблемы.

Фирма/год

1980

1981

1982

А

27,6

21,3

21,3

В

28,6

22,0

22,0

С

43,8

33,8

33,8

D

-

14,7

14,7

Е

-

8,2

8,2

В следующей таблице представлены объемы продаж в отрасли и доля каждой фирмы.

Фирма/ Год

1980 Знач.    %

1981   Знач.   %

1982   Знач.    %

В целом

7646,287      100,0

10458,140   100,0

13 475,974    100,0

А

1 926,300     25,2

1 571,417    15,0

1 595,742      11,8

В

2 347,987     30,7

3 073,511    29,4

3 660,954      27,3

С

3 372,000     44,1

4 381,000    41,9

5 677,000      42,1

D

-

596,755       5,7

1 042,278       7,7

Е

-

835,457       8,0

1 500,000       11,1

 

Можно заметить, что после появления фирм D и Е произошло резкое снижение доли фирмы А. Две новые фирмы D и Е по-разному освоили рынок. Фирма D имела большие производительные способности, чем фирма Е, но заметно отстала по объемам продаж. Этот пример интересен тем, что показывает соотношение затрат на рекламу и производство.

Будем считать, что основным показателем эффективности рекламы является объем продаж фирмы. В этой таблице представлены расходы на рекламу каждой фирмы и ее доля в рекламе.

Фирма/ Год

1980 Знач.  %

1981 Знач.   %

1982    Знач.    %

В целом

44,596    100,0

136,273      100,0

187,997          100,0

А

12,667   28,4

6,747          5,0

22,298            11,9

В

13,897   31,2

38,174       28,0

43,079            22,9

С

18,050   40,4

39,581      29,0

65,114            34,6

D

-

21,340     15,7

20,687            11,0

Е

-

30,421      22,3

36,519            19,6

Понятно, что вхождение в отрасль фирм D и Е потребовало больше расходов на рекламу (в процентном отношении к объему продаж). Это отчетливо видно из следующей таблицы:

Фирма/год

1980

1981

1982

А

0,7

0,4

1,4

В

0,6

1,2

1,2

С

б

0,9

1,1

D

-

3,6

2,0

Е

-

3,6

2,5

 

Заметим, фирма D в 1982 году резко снизила расходы на рекламу, что, возможно, стало причиной потери рынка.

Предполагается, что для рекламы используются следующие средства массовой информации: телевидение, газеты, журналы и радио.

Эффективность рекламы в каждом случае различна, и возникает вопрос о количественных зависимостях между объемом продаж и расходами на рекламу в каждом из средств массовой информации. Обычно доля телевидения составляет 70-90%, и поэтому в таблице, представляющей распределение расходов на рекламу между средствами массовой информации, все СМИ, кроме телевидения, объединены в одну группу «другие».

На реальный объем продаж пива влияют также такие факторы, как температура воздуха, число туристов и индекс потребительских цен (инфляция).

В предлагаемой модели теоретическая зависимость основывается на предположении, что объем продаж за период t (далее это месяцы) является функцией объема продаж за прошлый период расходов на рекламу в периоды t и t-1, количества туристов, значений температуры и индекса розничных цен.

s1 = b0 + b1St-1 + b2 Аt + bАt-1 + b4Tt + b5Wt + b6Pt

где

St — объем продаж (в драхмах);

At — ассигнования на рекламу;

Tt — число туристов в месяц t;

Wt — средняя температура воздуха;

Pt — индекс розничных цен.

Итак, мы построили модель зависимости, но коэффициенты этой модели неизвестны. Эти коэффициенты оцениваются из исходных данных в модуле Множественная регрессия.

Оценка коэффициентов по методу наименьших квадратов выявила статистическую незначимость переменных Wt и Pt, и они были исключены из дальнейшего анализа.


Полная версия страницы

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

Отзывы заказчиков по статистическому анализу данных

Дистантное обучение биостатистике с помощью IP-телефонии. Информация о специализированных курсах и семинарах по прикладной биостатистике для студентов, аспирантов, докторантов и научных сотрудников НИИ и вузов работающих в области биологии, медицины, социологии, психологии и т.д. (См. далее)

Отзывы по дистантному обучению статистике  

1998 - 2011.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций