интересно
Предыдущая | Содержание | Следующая

Выборочное распределение

Выборочное распределение (sampling distribution) — это распределение значений выборочных статистик, рассчитанныхдля каждой возможной выборки, которая формируется из изучаемой совокупности при определенном плане выборочного наблюдения. Предположим, что простую случайную выборку, включающую 5 больниц, нужно сформировать из генеральной совокупности 20 больниц. Можно получить(20х 19х 18х 17х 16)/(1х2х 3x4x5). или 15504 различных выборок каждая размером в 5 элементов. Распределение относительных частот средних значений этих 15504 различных выборок определяет выборочное распределение среднего.

Важная задача маркетингового исследования — вычисление таких статистик, как выборочное среднее и выборочная доля, и применение их для оценки соответствующих истинных значений генеральной совокупности. Процесс распространения результатов оценки выборки на оценку генеральной совокупности называется статистическим заключением (statistical inference). На практике создается одна выборка заданного объема и по ней вычисляются выборочные статистики (а именно, среднее и доля). Теоретически, для того чтобы оценить параметр изучаемой совокупности исходя из статистики выборки, нужно изучить каждую возможную выборку. Если бы все возможные выборки создавались в действительности, распределение статистики яатялось бы выборочным распределением. Несмотря на то, что на практике создается только одна выборка, понятие выборочного распределения очень важно. Это дает нам возможность использовать теорию вероятности для того, чтобы делать выводы относительно значений совокупности.

Важные характеристики выборочного распределения среднего и соответствующие характеристики доли для больших выборок (30 и больше) следующие.

Выборочное распределение среднего это нормальное распределение (Приложение 12А). Строго говоря, выборочное распределение доли биномиально. Однако для больших выборок (п = 30 и больше) его можно свести к нормальному распределению,

или доли (р)

равняется соответствующему значению параметра совокупности )1 или я.

Стандартная ошибка (standard error) среднего или доли относится к выборочному распреде лению среднего или доли, а не к выборке или всей совокупности. Формулы для определе ния стандартной ошибки:

Часто среднеквадратичное отклонение изучаемой совокупности о неизвестно. В таких случаях его расчетное значение получают из выборки с помощью следующей формулы:

Если о оценивается через 5, то стандартная ошибка среднего равна

,

где "расчет." обозначает, что s употребляется для расчета значения о.

Если не учитывать погрешность измерения, можно определить достоверность оценки параметра совокупности с помощью стандартной ошибки.

Аналогично, значение стандартной ошибки доли можно рассчитать, применив выборочную долю р для расчета генеральной доли я таким образом:

Площадь области под кривой выборочного распределения между любыми двумя точками можно рассчитать с помощью значений z (z value). Значение z точки — это число стандартных ошибок, на которое точка удалена от среднего. Значения z можно рассчитать следующим образом:

Например, площади областей, находящихся под одной стороной кривой, между средним и точками, которые имеют значения z, равные 1,0, 2,0 и 3,0, составляют соответственно 0,3413, 0,4772 и 0,4986 (табл. 2 в Приложении "Статистические таблицы"). В случае с долей значения z вычисляются аналогично.

7. Если объем выборки составляет 10% или больше от объема исследуемой совокупности, применение формул стандартной ошибки приведет к переоценке среднеквадратичного отклонения среднего или доли совокупности, Значит, его следует откорректировать, применив коэффициент окончательной коррекции совокупности, определяемый как