интересно
Предыдущая | Содержание | Следующая

Введение в теорию проверки гипотез

Этот раздел посвящен введению в теорию проверки гипотез. Базовый анализ данных неизменно включает в себя статистическую проверку гипотез. Приведем примеры гипотез в маркетинговых исследованиях.

Число постоянных покупателей универмага превышает 10% семей.

Потребители определенной марки товара, которые отличаются между собой уровнем его потребления (много и мало), различаются также и психографическими характеристиками.

Рассматриваемый отель имеет более высокий имидж, чем его ближайший конкурент,,

Чем лучше респондент знаком с рестораном, темчаще он его посещает.

В главе 12 мы рассмотрели понятия выборочного распределения, стандартную ошибку среднего и доли и доверительный интервал. Все они относятся к проверке гипотезы и поэтому необходимо вспомнить их. Ниже мы опишем общую схему проверки гипотезы, которая применима к проверке гипотез с большим диапазоном параметров.

ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ

Для проверки гипотезы необходимо выполнить следующие этапы (рис. 15.3).

Сформулировать нулевую гипотезу Ная альтернативную гипотезу Н,.

Выбрать подходящий метод статистической проверки гипотезы (статистический критерий) и соответствующую статистику критерия (выборочную статистику, тест-статистику).

Выбрать уровень значимости а.

Определить размер выборки и собрать данные. Вычислить значение выборочной статистики.

Определить вероятность, которую примет статистика критерия (выбранная на этапе 2) при выполнении нулевой гипотезы, используя соответствующее выборочное распределение. Альтернативный вариант данного этапа: определить критическое значение статистики, которое делит интервал на область принятия и непринятия нулевой гипотезы.

6. Сравнить полученную вероятность для тест-статистики (статистики, построенной по результатам выборочного наблюдения) с заданным уровнем значимости. Альтернативный вариант данного этапа: определить, попадает ли выборочное значение тест-статистики в область принятия или отклонения нулевой гипотезы.

Принять статистическое решение, касающееся того, принять или отвергнуть нулевую гипотезу.

Выразить статистическое решение с точки зрения проблемы маркетингового исследования.

Этап 1. Формулировка гипотез

На первом этапе маркетолог формулирует нулевую и альтернативную гипотезы. Нулевая гипотеза (null hypothesis) утверждает, что между определенными статистическими параметрами генеральной совокупности (средними или долями) не существует связи или различия. Ее подтверждение не требует от компании каких-либо действий.

Альтернативная гипотеза (alternative hypothesis) — это гипотеза, предполагающая, что между определенными статистическими параметрами генеральной совокупности (средними или долями) есть связь или различия. Ее подтверждение означает, что руководству компании следует предпринимать какие-либо действия или менять свои взгляды на положение дел. Таким образом, альтернативная гипотеза противоположна нулевой.

Маркетолог всегда проверяет именно нулевую гипотезу. Она имеет отношение к конкретному значению параметра совокупности (например, Ц, ст, л ), а не к выборочным статистикам (например, X ). Проверка гипотез имеет два исхода: нулевая гипотеза отвергается, а альтернативная — принимается, или нулевая гипотеза не отклоняется, исходя из представленных доказательств. Следовательно, по результатам статистической проверки нулевую гипотезу не следует принимать, т.е. некорректно заключить, что, поскольку нулевую гипотезу не отклоняют, ее можно принять как истинную. В классической теории проверки гипотез сложно определить, достоверность нулевой гипотезы.

В маркетинговых исследованиях нулевую гипотезу формулируют так, что ее непринятие ведет к желаемому заключению. Альтернативная гипотеза представляет заключение, для которого маркетологи ищут доказательство его справедливости. Например, руководство универмага хотело бы начать торговлю своими товарами через Internet. Новую услугу введут в действие, если свыше 40% пользователей Internet используют сеть для совершения покупок. Маркетолог записывает гипотезы следующим образом:

Если нулевую гипотезу, отклоняют, то принимают альтернативную гипотезу Н:, значит, стоит ввести новую услугу — приобретение товаров через Internet. С другой стороны, если нулевую гипотезу //„не отклоняют, то новую услугу не стоит внедрять до тех пор, пока не будет получено дополнительных доказательств для того, чтобы заняться Internet-торговлей.

В рассматриваемом случае для проверки гипотезы используют односторонний критерий (one-tailed test), так как альтернативная гипотеза имеет четко выраженное направление: доля пользователей Internet, которые используют его для приобретения товаров, больше 0,40.

С другой стороны, предположим, что исследователь хочет определить, действительно ли доля пользователей Internet, которая осуществляет покупки через сеть, отличается от 40%. Для этого использует двусторонний критерий (two-tailed test), а гипотезы запишем в следующем виде:

В практике маркетинговых исследований односторонний критерий используют чаще, чем двусторонний. Обычно существует какое-либо предпочтительное направление измененения характеристик, подлежащее доказательству. Например, чем выше прибыль, объем продаж и качество продукта, тем это лучше для фирмы. Односторонний критерий сильнее двустороннего. Мощность статистического критерия обсуждается ниже, при рассмотрении этапа 3.

Этап 2. Выбор подходящего метода проверки

Для проверки нулевой гипотезы необходимо выбрать подходящий статистический метод (статистический критерий). Исследователь должен принимать во внимание саму процедуру вычисления выборочной статистики и характерное для нее выборочное распределение. Выборочная статистика критерия (test statistic) служит для того, чтобы можно было сделать вывод о том, насколько близко выборка соответствует нулевой гипотезе.

Выборочная статистика часто имеет такие широко распространенные распределения, как нормальное, Стьюдента {(-распределение) или хи-квадрат распределение. Правила выбора подходящего метода проверки обсуждаются ниже. В нашем примере наиболее приемлема z,-статистика, которая имеет нормальное распределение. Она вычисляется по формуле

Этап 3. Выбор уровня значимости

Какой бы вывод мы ни сделали в отношении изучаемой совокупности, всегда существует риск неверного заключения. При этом встречаются два типа ошибок.

Ошибку I рода (Type I error) совершают, когда, исходя из результатов выборочного распределения, отклоняют нулевую гипотезу, в то время как она фактически верна.

В нашем примере ошибка I рода имела бы место, если мы, исходя из данных выборки, установили бы, что доля потребителей, предпочитающих новый вид услуг, больше 0,40 (40%), в то время как фактически она была бы меньше либо равна 0,40. Вероятность ошибки I рода (а) также называют уровнем значимости (level ofsignificance).

Вероятность ошибки первого рода устанавливается, исходя из допустимого уровняй риска отклонения истинной нулевой гипотезы. Выбор уровня риска зависит от того, во сколько оценивается ошибка первого рода.

Ошибку II рода (Туре II error) совершают, когда, исходя из результатов выборки, не отклоняют нулевую гипотезу, которая в действительности является ошибочной. В нашем примере ошибка II рода имела бы место, если мы, исходя изданных выборки, установили бы, что доля потребителей, предпочитающих новый вид услуг, меньше или равна 0,40, в то время как фактически она была бы больше 0,40. Вероятность ошибки II рода обозначается р В отличие от а, значение которой устанавливает сам исследователь, величина В зависит от фактического значения параметра генеральной совокупности (например, доли). Вероятность совершения ошибки I рода (а) и вероятность ошибки II рода (|i) показаны на рис. 15.4. Вероятность (1 - |>) совершения ошибки II рода также называют мощностью статистического критерия.

Мощность критерия (power ofa test) представляет собой вероятность (1 — В) отклонения ну-, левой гипотезы, когда она неверна и должна быть отвергнута. Хотя величина В неизвестна, она связана с а. Чрезвычайно низкое значение ОЕ (например, 0,001) приведет к недопустимо высокому значению р. Поэтому необходимо сбалансировать два типа ошибок. В качестве компромисса а часто устанавливают равной 0,05; иногда ей присваивают значение 0,01; другие значения а встречаются редко. Уровень а, наряду с размером выборки, определяет уровень j3 для конкретного исследовательского проекта. Риском аир можно управлять, увеличив размер выборки. Для данного уровня значимости а увеличение размера выборки уменьшит значение Р,, повысив тем самым мощность статистического критерия.

Этап 4. Сбор данных

Размер выборки определяют, приняв во внимание желаемые значения вероятностей совершения ошибок I и II рода и других количественных факторов, например финансовых ограничений. Затем собирают необходимые данные и вычисляют значение выборочной статистики. В нашем примере из 30 опрошенных пользователей Internet 17 отметили, что они приобретают товары через Internet. Таким образом, выборочная доля этих пользователей Internet составляет

Значение о> можно определить по следующей формуле:

Этап 5. Определение критического значения z-статистики

Используя таблицы нормального распределения (табл. 2 Приложения), можно вычислить вероятность получения значения z, равного 1,88 (рис. 15.5).

Площадь закрашенной области между ч= и 1,88 равна 0,9699. Следовательно, площадь, незакрашенной области справа от 2 =1,88 равна 1,0000 — 0,9699 = 0,0301. Альтернативно, критическое значение J, которое отсекает область, имеющую площадь а = 0,05 и расположенную справа от критического значения, находится между 1,64 и 1,65 и равно 1,645. Обратите внимание, что при определении критического значения выборочной статистики область вправо от критического значения критерия равна либо а либо а/2. Это значение равно а для одностороннего критерия и а/2 — для двустороннего.

Этапы 6 и 7. Сравнение выборочного значения z-статистики с критическим значением

и принятие решения

Итак, маркетологи выяснили, что вероятность того, что вычисленная ими выборочная статистика больше 1,88, равна 0,0301. Это вероятность получения значения, равного 0,567 при р =0.40. Это число меньше выбранного уровня значимости, равного 0,05. Следовательно, нулевая гипотеза отклоняется. Альтернативно исследователи могут поступить следующим образом. Они видят, что полученное значение ^-статистики = 1,88 лежит в области отклонения нулевой гипотезы (а критической области), справа от значения 1,645. Поэтому снова можно сделать такой же вывод, т.е. отклонить нулевую гипотезу. Обратите внимание, что два способа проверки нулевой гипотезы эквивалентны по выводу, но математически отличаются направлением сравнения. Если вероятность получения вычисленного значения выборочной статистики ( TSCAL), меньше, чем уровень значимости (а), то нулевую гипотезу отклоняют. Справедливо и следующее утверждение: если вычисленное значение выборочной статистики больше, чем ее критическое значение (TSCS), то нулевую гипотезу также отклоняют. Причина этой перемены

знаков в том, что чем больше значение TSVAL, тем меньше вероятность получения высокого

значения выборочной статистики при условии выполнения нулевой гипотезы. Запишем этот в следующем виде:

отклоняют,

или

  то нулевую гипотезу отклоняют.

Этап 8. Вывод с точки зрения маркетингового исследования

На основании результатов проверки статистической гипотезы следует сделать заключение с точки зрения стоящей перед нами проблемы маркетингового исследования. В нашем примере мы заключаем, что существует статистически значимое доказательство того, что доля пользователей Internet, которые приобретают товары через Internet, выше, чем 0,40. Следовательно, универмагу можно порекомендовать вводить новую услугу — приобретение товаров через Internet.

Как видно из рис. 15.6, маркетологи используют проверку статистической гипотезы как для проверки наличия связей между переменными, так и для проверки различий между параметрами генеральной совокупности.

Проверка различий может относиться к распределениям, средним, долям, медианам или рангам. Сначала мы обсудим гипотезы, относящиеся к проверке связей с точки зрения кросс-табуляции.