интересно
Предыдущая | Содержание | Следующая

Метод доверительных интервалов

Определение объема выборки методом доверительных интервалов основано на их создании вокруг выборочного среднего или выборочной доли с использованием формулы стандартной ошибки. В качестве примера предположим, что исследователь провел простую случайную выборку из 300 семей, чтобы оценить ежемесячные расходы семьи на покупки в универмаге, и определил, что средний ежемесячный расход семьи в выборке равен 182 доллара. Предыдущие исследования показали, что среднеквадратичное отклонение расходов в исследуемой совокупности равно 55 долларов.

величины расходов.

, можно рассчитать следующим образом:

  определяется как

Теперь установим 95%-ный доверительный интервал вокруг выборочного среднего, равного 182 доллара. Для начала мы вычислим стандартную ошибку среднего:

Таким образом, 95%-ный доверительный интервал находится в пределах от 175,77 до 188,23 доллара. Вероятность нахождения истинного среднего значения наблюдаемой совокупности в пределах от 175,77до 188,23 доллара составляет 95%.

Определение объема выборки: среднее

Метод, использованный для создания доверительного интервала, можно модифицировать так, чтобы определить объем выборки с учетом желательного доверительного интервала. Предположим, что вы хотите рассчитать ежемесячный расход семьи на покупки в универмаге более точно, так, чтобы полученный результат находился в пределах ±5,00 долларов от истинного среднего значения исследуемой совокупности. Каким должен быть объем выборки? В табл. 12.2 приведен необходимый перечень действий, который вы должны выполнить.

Определите степень точности. Это максимально допустимое различие (/?) между выборочным средним и генеральным средним. В нашем примере D = ±5,00 долларов.

Укажите уровень достоверности. Предположим, что желательный уровень достоверности 95%.

Определите значение z„ связанное с данным уровнем достоверности, воспользовавшись табл. 2 в Приложении "Статистические таблицы". При 95%-ном уровне достоверности вероятность того, что среднее значение генеральной совокупности выйдет за пределы одностороннего интервала, равна 0,025 (0,05/2). Соответствующее значение z составляет 1,96.

Определите стандартное отклонение среднего генеральной совокупности. Его можно получить из вторичных источников или рассчитать, проведя пилотное исследование. Кроме того, стандартное отклонение можно установить на основе мнения исследователя. Например, диапазон нормально распределенной переменной примерно укладывается в шесть стандартных отклонений (по три слева и справа от среднего значения). Таким образом, можно рассчитать среднеквадратичное отклонение, разделив величину всего диапазона на 6. Исследователь часто может определить раз-мерыдиапазон, исходя из собственного понимания анализируемыхявлений.

Определите объем выборки, воспользовавшись формулой стандартной ошибки среднего;

(округленное в большую сторону до ближайшего целого числа).

Из формулы объема выборки видно, что она растет с ростом изменчивости генеральной совокупности, а также с увеличением уровня достоверности и степени точности, с которой

должны проводиться расчеты. Объем выборки прямо пропорционален СУ1, поэтому, чем больше показатель изменчивости генеральной совокупности, тем больше объем выборки. Аналогично, более высокий уровень достоверности предполагает большее значение г и,

следовательно, больший объем выборки. Переменные О и z находятся в числителе. Увеличение степени точности достигается уменьшением значения D и, следовательно, увеличивает объем выборки, поскольку D находится в знаменателе.

Если объем выборки составляет 10% и больше от объема генеральной совокупности, то применяется окончательная коррекция совокупности (fpc). Затем необходимый объем выборки рассчитывается по формуле

где п — объем выборки до применения окончательной коррекции;

пс — объем выборки после применения окончательной коррекции.

7, Если среднеквадратичное отклонение совокупности ст неизвестно и используется его предположительное значение, то его следует повторно рассчитать после получения выборки. Среднеквадратичное отклонение выборки 5 используется в качестве предположительного значения ст. Затем следует вычислить исправленный доверительный интервал, чтобы определить фактически полученную степень точности.

.Предположим, что значение 55,00 использовалось в качестве предположительного значения а, потому что истинное значение было неизвестно. Получена выборка, в которой п = 465. На основе данных исследования рассчитывается среднее X, равное 180,00, и среднеквадратичное отклонение выборки s, равное 50,00. Тогда исправленный доверительный интервал составит

или

Обратите внимание, что полученный доверительный интервал >Же предполагаемого. Это вызвано тем, что среднеквадратичное отклонение совокупности завышено на основании выборочных характеристик.

8. Иногда точность определена в относительных, а не абсолютных показателях. Другими словами, может быть известно, что результат вычисления должен составить плюс-минус К% от среднего. Это означает, что D = Кц.

В этом случае объем выборки можно определить как

Объем генеральной совокупности #не влияет на объем выборки напрямую, за исключением случаев, когда применяется коэффициент окончательной коррекции совокупности. Возможно, это кажется невероятным, но если подумать, в этом утверждении есть смысл. Например, если исследуемые характеристики всех элементов совокупности идентичны, то выборки, состоящей из одного элемента, вполне достаточно, чтобы рассчитать среднее. Это также правильно, если совокупность состоит из 50, 500, 5000 или 50000 элементов. В то же время изменчивость характеристик совокупности напрямую влияет на объем выборки. Эта изменчивость учитывается при вычислении объема выборки с помощью дисперсии совокупности о- или дисперсии выборки **.