интересно
Предыдущая | Содержание | Следующая

Вероятностный метод выборки

Вероятностные методы выборки отличаются между собой степенью эффективности. Эффективность выборки — это понятие, отражающее компромисс между затратами, связанными с проведением выборки, и ее точностью. Точность выборки — это степень неопределенности, связанная с измеряемой характеристикой. Чем больше точность, тем выше стоимость, а проведение большинства исследований требует соблюдения разумного баланса затрат и результатов. Исследователь должен стремиться разработать максимально эффективный план выборочного наблюдения с учетом выделенного бюджета. Эффективность вероятностного метода выборки можно оценить, сравнив ее с эффективностью простой случайной выборки.

Простая случайная выборка

При проведении простой случайной выборки (Simple Random Sampling — SRS) каждый элемент совокупности имеет известную и равную вероятность отбора. Более того, каждая возможная выборка данного объема (я I имеет известную и равную вероятность того, что она станет выборочной совокупностью. Это означает, что каждый элемент отбирается независимо от другого. Выборка формируется произвольным отбором элементов из основы выборки. Этот метод похож на розыгрыш лотереи, когда таблички с именами участников помещаются в барабан, который встряхивается, и из него произвольным образом извлекают отдельные таблички, в результате объективно определяются имена победителей.

При простой случайной выборке исследователь сначала формирует основу выборочного наблюдения, в которой каждому элементу присваивается уникальный идентификационный номер. Затем генерируются случайные числа, чтобы определить номера элементов, которые будут включены в выборку. Эти случайные числа могут генерироваться компьютерной программой или выбираться из таблицы (см. табл. 1 в Приложении "Статистические таблицы"). Предположим, что выборочную совокупность, объем которой равен 10, нужно сформировать из основы выборочного наблюдения, содержащей 800 элементов. Поступают таким образом: выбирают по три правые цифры в каждом ряду, начиная с первой колонки и первого ряда табл. 1, и двигаются вниз, пока не будет отобрано 10 чисел из 800. Числа, которые находятся за пределами этого диапазона, не включаются. Выборочная совокупность создается из элементов, соответствующих случайно выбранным номерам. Тик, в нашем примере будут выбраны элементы: 480, 368, 130, 167, 570, 562, 301, 579, 475 и 553. Обратите внимание, что последние три цифры ряда 6 (921) и ряда И (918) не включены в выборочную совокупность, поскольку они находятся за пределами установленного диапазона.

Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность, Большинство подходов к получению статистических выводов предусматривают сбор информации с помошью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения. Во-первых, часто сложно создать основу выборочного наблюдения, которая позволила бы провести простую случайную выборку. Во-вторых, результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных. В-третьих, результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов. В-четвертых, в результате применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объеме выборки. Простая случайная выборка не часто используется в маркетинговых исследованиях. Более популярен метод систематической выборки.

Систематическая выборка

При проведении систематической выборки (systematic sampling) сначала задают произвольную отправную точку, а затем из основы выборочного наблюдения последовательно выбирают каждый 1-й элемент. Интервал выборки i определяется как отношение объема совокупности Лк объему выборки я, с округлением результата до ближайшего целого числа. Например, совокупность состоит из 100 тысяч элементов, а желательный объем выборки равен тысяче респондентов. В этом случае интервал выборки / равен 100. Выбирается случайное число между 1 и 100. Если, например, это число равно 23, то выборка состоит из элементов 23, 123, 223, 323, 423, 523 ит.д..

Обшей чертой систематической выборки и простой случайной выборки является то, что каждый элемент генеральной совокупности имеет известную и равную вероятность выбора. Систематическая выборка отличается от SRS тем, что только допустимые выборки объема л, которые можно получить из генеральной совокупности, имеют известную и равную вероятность выбора. Остальные выборки объема п имеют нулевую вероятность выбора.

При систематической выборке исследователь предполагает, что элементы совокупности расположены в определенном порядке. В некоторых случаях принцип сортировки (например, алфавитный перечень в телефонной книге) не имеет отношения к исследуемой характеристике. В других случаях сортировка непосредственно связана с исследуемой характеристикой. Например, имена владельцев кредитных карточек приводятся с учетом суммы их баланса, а названия фирм определенной отрасли располагаются согласно годовому объему их продаж. Если элементы совокупности расположены по принципу, не связанному с исследуемой характеристикой, результаты систематической выборки аналогичны результатам SRS.

С другой стороны, если принцип расположения элементов связан с исследуемой характеристикой, систематический отбор увеличивает репрезентативность выборки. Если фирмы какой-либо отрасли расположены по принципу увеличения годового объема продаж, систематическая выборка будет включать как мелкие, так и крупные фирмы. Простая случайная выборка в данном случае может быть нерепрезентативной, включая, например, только мелкие фирмы или непропорциональное число мелких фирм. Если расположение элементов выборки носит циклический характер, систематическим методом можно уменьшать представительность выборки. В качестве примера рассмотрим применение систематического отбора для формирования выборки ежемесячных объемов продаж универмага из основы, содержащей ежемесячные объемы продаж за последние 60 лет. Если задать выборочный интервал, равный 12, то конечная выборка не будет отражать ежемесячные изменения в объемах продаж.

Систематическая выборка дешевле и проще, чем простая случайная, поскольку случайный отбор осуществляется только один раз. Кроме того, случайные числа не должны соответствовать определенным элементам, как в SRS. Учитывая, что некоторые перечни содержат миллионы элементов, использование этого метода значительно экономит время, что, в свою очередь, способствует снижению затрат, связанных с исследованием. Если совокупность обладает информацией об исследуемой характеристике, систематический отбор дает возможность получить более репрезентативную и достоверную (с меньшей ошибкой выборки) выборку, чем метод SRS. Еще одно важное преимущество: систематический отбор можно применять даже не зная структуру основы выборочного наблюдения. Например, можно опросить каждого i-ro человека, покидающего универмаг или торговый центр. Поэтому систематический отбор часто применяется при проведении почтовых и телефонных опросов, а также интервью-"перехватов" в торговых центрах, как показано во врезке I I I "Практика маркетинговых исследований".

Врезка 11.1. Практика маркетинговых исследований

Систематическая выборка подписчиков журнала Tennis

Журнал Tennis провел почтовый опрос своих подписчиков, чтобы составить полное представление о читателях. С помощью систематического отбора составили выборку из 1472 подписчиков издания внутри страны. Если допустить, что список подписчиков содержал 1,472 миллиона фамилий, интервал выборки составит 1000 (1472000/1472). Выбрано произвольное число от 1 до 1000. Начиная с этого числа, был отобран каждый тысячный.

К анкете прилагался новенький доллар, как материальный стимул для респондентов. За неделю до опроса отправили предупредительную почтовую открытку. Через 10 дней после отправки первой анкеты всем респондентам отослали повторную анкету. 76 анкет вернулись по почте, таким образом, результативность почтовой отправки составила 1396. Через шесть недель после первой отправки вернулось 778 заполненных анкет, что определило коэффициент отклика на уровне 56%.