интересно
Предыдущая | Содержание | Следующая

Разложение полной вариации

Для изучения различий между средними однофакторный дисперсионный анализ использует разложение полной вариации (decomposition of the total variation), наблюдаемой в зависимой переменной.

Эту вариацию вычисляют как сумму квадратов с поправкой на среднее (на число степеней свободы) (SS).Дисперсионный анализ называют так потому, что он изучает изменчивость или дисперсию выборки (применительно к зависимым переменным) и, исходя из этой изменчивости, определяет, действительно ли выборочные средние равны между собой.

Полную вариацию У, обозначаемую SS, можно разложить на два компонента:

— это вариация переменной ), связанная с вариацией внутри каждой группы переменной X, ее вычисляют, не учитывая фактор X. Поэтому SSa также называют дисперсией ОШИбкИ SSoMttfiKfc-

в том, чтобы наглядно представить и затем изучить различия в групповых средних. Вспомним из главы 15, если вариация переменной в совокупности известна, то можно определить, насколько сильно изменение выборочного среднего обусловлено только случайной вариацией. В дисперсионном анализе рассматривают несколько различных групп (например, сильное, среднее, слабое использование, отсутствие использования товара). Если нулевая гипотеза верна, и все группы имеют одно и то же среднее значение совокупности, то можно оценить, насколько сильно отличаются выборочные средние вследствие только выборочной (случайной) вариации. Если наблюдаемое различие в выборочных средних больше ожидаемого, то логично заключить, что эта дополнительная вариация связана с различиями в групповых средних в совокупности.

(межгрупповая изменчивость).

Внутригрупповая вариация показывает, насколько сильно колеблятся значения переменной Y внутри группы. Поэтому ее используют для оценки дисперсии внутри группы. Предполагается, что все группы в рассматриваемой совокупности имеют одну и ту же вариацию. Однако из-за того, что неизвестно, имеют ли все группы одно и то же значение средней, мы не может вычислить дисперсию всех объединенных вместе наблюдений. Дисперсия для каждой группы рассчитывается отдельно, и затем эти дисперсии следует объединить в "среднюю" или "общую". Аналогично, можно получить другую оценку дисперсии значений Y, изучив вариации между средними- (Этот процесс обратный процессу определения вариации в средних.) Если среднее совокупности одно и то же во всех группах, то для оценки дисперсии К используем вариацию в выборочных средних и размеры выборочных групп. Приемлемость этой оценки дисперсии К зависит от истинности нулевой гипотезы. Если нулевая гипотеза верна и средние совокупности равны, то оценка дисперсии на основе межгрупповой изменчивости корректна. С другой стороны, если группы имеют различные средние в совокупности, то оценка дисперсии на основе межгрупповой изменчивости слишком большая. Таким образом, сравнивая оценки дисперсии на основе межгрупповой и внутригрупповой изменчивости (вариации), мы можем проверить нулевую гипотезу [Щ. Разложение полной вариации также позволяет измерить влияние переменной X на Y.