интересно
Предыдущая | Содержание | Следующая

Перекрестная проверка

Прежде чем оценить относительную важность предикторов или сделать какие-либо другие выводы, необходимо подвергнуть регрессионную модель перекрестной проверке. Дело в том, что для регрессии и других многомерных процедур характерно выявление случайных вариаций переменных. Это приводит к тому, что уравнение регрессии становится чрезмерно чувствительным к конкретным данным, используемым для построения модели. Одним из подходов для оценки модели из-за этой и других проблем, связанных с регрессией, — перекрестная проверка. Перекрестная проверка (cross-validation) позволяет проанализировать, действительно ли регрессионная модель распространяется на сопоставимые данные, которые не использовались для построения модели.

Типичная процедура перекрестной проверки, используемая в маркетинговых исследованиях, состоит из следующих стадий.

ЬМаркетологирассчитываютрегрессионнуюмоделциспользуяполныйнаборданных.

Имеющиеся данные делят на две части: расчетную выборку и контрольную выборку. Расчетная выборка обычно содержит от 50 до 90% данных общей выборки.

,3. Регрессионную модель рассчитывают, используя только данные из расчетной выборки. Эту модель сравнивают с моделью, рассчитанную поданным полной выборки, чтобы определить их соответствие с точки зрения знаков и величин частных коэффициентов регрессии.

Рассчитанную модель применяют к данным из контрольной выборки чтобы определить значения зависимой переменной ). для наблюдений в контрольной выборке.

Наблюдаемые значения У. и расчетные теоретические значения У, в контрольной выборке

сопоставляют, чтобы определить линейный коэффициент детерминации г. Его сравнивают с коэффициентом R1 для полной выборки и с Я* — для расчетной выборки, чтобы оценить степень сжатия.

Специальную форму проверки называют двойной перекрестной проверкой. При двойной перекрестной проверке (double cross-validation) выборку делят на две равные половины.

При выполнении перекрестной проверки одна половина служит расчетной выборкой, вторая — контрольной. Затем места расчетной и контрольной выборок меняются и перекрестную проверку повторяют.