интересно
Предыдущая | Содержание | Следующая

Выполнение парного регрессионного анализа

Стадии, из которых состоит процедура парного регрессионного анализа, приведены на рис. 17.2.

Предположим, что маркетолог хочет выяснить, зависит ли отношение к городу от длительности проживания в нем (см. табл. 171). При выводе уравнения такой зависимости целесообразно вначале изучить поле корреляции,

Поле корреляции

Это графическое изображение точек с координатами, соответствующими значениям двух переменных для всех случаев. Обычно значения зависимой переменной откладывают по вертикальной оси, в значения независимой — по горизонтальной. Поле корреляции используется при определении формы зависимости между переменными, График дает исследователю первое представление о форме данных и о возможных проблемах. На графике легко идентифицировать любую необычную комбинацию переменных. График зависимости У (отношение к городу) от ^(продолжительность проживания) дан на рис. 17.3.

Из рисунка видно, что точки располагаются полосой от нижнего левого угла в верхний правый. На графике можно увидеть форму зависимости: с ростом одной переменной другая переменная также увеличивается. Из рисунка видно, что зависимость между Уж X носит линейный характер и поэтому может быть описана уравнением прямой линии. Как следует "подогнать" к этим точкам прямую линию, чтобы она наилучшим образом описывала данные?

Самый распространенный метод для расчета уравнения линейной регрессии по данным на диаграмме рассеяния — это метод наименьших квадратов (leasl-squaresprocedure).

Методом наименьших квадратов определяют наиболее подходящую прямую регрессии, минимизируя расстояния по вертикали всех точек поля корреляции от этой прямой. Наиболее подходящая прямая называется линией регрессии. Если точка поля не лежит на линии регрессии, то расстояние по вертикали от нее до линии называется ошибкой е (рис. 17.4)

Для определения

наиболее подходящей линии с помощью метода наименьших квадратов минимизируют суммы квадратов ошибок. Если значения К отложить по вертикальной оси, а значения X— по горизонтальной, как показано на рис. 17.4, то полученная аппроксимированная линия называется регрессией Утю X, так как расстояния по вертикали минимизированы. Поле корреляции показывает, можно ли зависимость ) по Xвыразить прямой линией и, следовательно, подходит ли к этим данным парная регрессионная модель.