интересно
Предыдущая | Содержание | Следующая

Кластерная выборка

В кластерной выборке (cluster sampling) изучаемая совокупность сначала делится на взаимоисключающие и взаимодополняющие подгруппы, или кластеры (dusters). Затем с помощью вероятностного метода выборки, такого как SRS, формируется случайная выборка кластеров. В выборку включаются либо все элементы отобранного кластера, либо проводится их отбор вероятностным методом, Если в выборку включаются все элементы каждого отобранного кластера, то такая процедура называется одноступенчатой кластерной выборкой. Если выборка получена с помощью вероятностного отбора из каждого выбранного кластера, такая процедура называется двухступенчатой кластерной выборкой. Как показано на рис. 11.3, существуют два вида двухступенчатой кластерной выборки — простая двухступенчатая кластерная выборка с использованием SRS и вероятностная выборка, пропорциональная объему (PPS). Кроме того, кластерная выборка может состоять из нескольких (больше двух) этапов, выступая как многоступенчатая кластерная выборка.

Основное различие между кластерной и стратифицированной выборкой состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как в стратифицированной выборке все подгруппы (слои) используются для дальнейшего отбора. Эти методы преследуют разные цели. Цель кластерной выборки — увеличить эффективность выборки, уменьшив затраты на ее проведение. Цель стратифицированной выборки — увеличение точности. По однородности и неоднородности критерии формирования кластеров прямо противоположны критериям формирования слоев. Элементы кластера должны быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности. При кластерной выборке основа выборочного наблюдения необходима только для кластеров, которые вошли в выборку.

Распространенная форма кластерной выборки — территориальная выборка (area sampling), в которой кластеры состоят из географических территорий, таких как округа, жилые районы или кварталы. Если отбор основных элементов проводится в один этап (например, исследователь выбирает некоторые кварталы, а затем все семьи, живущие в этих кварталах, включаются в выборку), такой выборочный метод называется одноступенчатой территориальной выборкой. Если отбор основных элементов проводится в два (или больше) этапа (исследователь выбирает кварталы, а затем в каждом таком квартале отбирает семьи, которые будут включены в выборку), такой метод называется двухступенчатой (или многоступенчатой) территориальной выборкой. Отличительная черта одноступенчатой территориальной выборки заключается в том, что все семьи из выбранных кварталов (или географических регионов) включаются в выборку.

Как показано на рис. 11.3, существует два типа двухэтапной кластерной выборки. В одном из них метод SRS применяется как на первом этапе (т.е. при выборе кварталов), так и на втором (т.е. при отборе семей в кварталах). Этот метод называется простой двухступенчатой кластерной выборкой. При использовании этого метода количество элементов (семей), отобранных на втором этапе, одинаково для каждого выбранного кластера (отобранного квартала). Следующий пример иллюстрирует применение двухступенчатой территориальной выборки.

Этот метод подходит в том случае, когда все кластеры равны по объему, т.е. каждый кластер содержит примерно одинаковое количество единиц. Однако, если объемы различны, простая двухступенчатая кластерная выборка может привести к ошибочным результатам. Иногда, объединив различные кластеры, можно сделать их равными по объему. Если объединить кластеры нельзя, следует воспользоваться вероятностной выборкой, пропорциональной объему (PPS).

При вероятностной выборке, пропорциональной объему (Probability Proportionate to size Sampling — PPS) кластеры отбираются с вероятностью, пропорциональной их объему. Объем кластера определяется количеством входящих в него единиц выборки. Поэтому на первом этапе большие по объему кластеры имеют большую вероятность включения в выборку. На втором этапе вероятность отбора единицы из выбранного кластера обратно пропорциональна его объему. Поэтому вероятность включения в выборку будет равной для всех выборочных единиц, поскольку неравная вероятность включения на первой стадии отбора компенсируется неравной вероятностью включения на второй стадии.

Кластерная выборка обладают двумя основными преимуществами — выполнимость и низкая себестоимость. Во многих ситуациях единственными легкодоступными инструментария-ми для изучения совокупности будут не элементы, а кластеры. Часто невозможно составить список всех потребителей, входящих в состав определенной совокупности, принимая во внимание ресурсы данного исследования и связанные с ним ограничения. Однако перечень географических территорий, телефонных кодов определенного района и других кластеров потребителей получить довольно легко. Кластерная выборка наиболее эффективна с точки зрения затрат. Однако несмотря на это преимущество, ей присущ ряд ограничений. В результате отбора по кластерам создаются относительно неточные выборки. Кроме того, сложно сформировать неоднородные кластеры, так как, например, семьи, живущие в одном квартале, имеют больше схожих признаков, чем различий. После кластерной выборки сложно рассчитать и оценить статистику. Все преимущества и недостатки основных методов формирования выборки, в том числе преимущества и недостатки кластерной выборки, приведены в табл. 11.3. Рис. Прописывает процедуры формирования вероятностных выборок.