Вероятностная выборка

Вероятностная выборка - это выборка, сформированная вероятностным (случайным) способом, при котором каждый элемент совокупности имеет определенный, неравный нулю, шанс оказаться включенным в выборку. Вероятностная выборка извлекается из статистической основы наблюдения с использованием плана выборки. На практике выборочный план представляет собой сочетание различных способов извлечения выборок или выборочных методов. Он может включать стратификацию или кластеризацию статистической основы наблюдения, а также несколько этапов отбора.

План выборки должен быть адекватно определен относительно целей статистического наблюдения; он должен быть максимально простым, насколько это позволяют цели и задачи проведения статистического наблюдения. Статистическая основа наблюдения должна быть четко определена согласно оценке ее соответствия целям наблюдения. План выборки обеспечивает расслоение (стратификацию) единиц для формирования слоев (страт) однородных единиц по отношению к информации, которая должна быть собрана, и описание разрезов разработки, которые будут получены в результате объединения элементарных слоев.

Оптимальный объем выборки определяется статистическими вероятностными методами для обеспечения необходимой точности оценок для основных переменных в целом по совокупности, а также в основных разрезах разработки.

Если ожидается значительное сокращение объема выборки из-за большого количества неответов респондентов, целесообразно предусмотреть достаточное количество резервных единиц выборки.

План выборки должен предусматривать возможность оценки ошибок выборки. В качестве этой оценки используются коэффициент вариации оценки, стандартная ошибка оценки, средний квадрат ошибки выборки. Задача формирования выборочной совокупности решается либо с помощью стандартного программного обеспечения (например, SPSS, Statistica и др.), либо с использованием специального разработанного программного обеспечения, которое должно быть предварительно и качественно протестировано.

Целесообразно проанализировать альтернативные методы формирования выборки, чтобы оценить все плюсы и минусы каждого из них. Все аспекты планирования выборочного статистического наблюдения должны быть надлежащим образом задокументированы.

Как уже было сказано выше, на практике выборочный план может представлять собой сочетание различных способов извлечения выборок или выборочных методов, таких как, простой случайный отбор, систематический отбор, отбор с вероятностями, пропорциональными размеру единиц, расслоенный случайный отбор, кластерный отбор (гнездовая выборка; многоступенчатый отбор), многофазная выборка.

Простой случайный отбор редко применяется самостоятельно, но знание сущности этого метода чрезвычайно важно для лучшего понимания более сложных планов выборки, используемых на практике. Применение этого метода не требует никаких вспомогательных данных, а также дает возможность аппроксимации более сложного плана выборочного обследования. Простой случайный отбор единиц из основы выборки осуществляется таким образом, что каждый элемент совокупности имеет одинаковую вероятность включения, т.е. данная выборка является равновероятностной.

Систематический отбор - это процедура формирования выборочной совокупности, которая имеет ряд практических преимуществ, в частности, простота ее осуществления. Первый элемент такой выборки извлекается случайно с равной вероятностью из первых a элементов списка. Положительное целое число a определяется заранее и называется выборочным интервалом. Далее для построения систематической выборки случайные извлечения уже не потребуются. Остальные элементы выборки определяются систематически: из списка отбирается каждый a-ый элемент, и так до конца списка. Таким образом, имеются только a возможных выборок, имеющих одну и туже вероятность отбора, равную 1/a.

Выборка с вероятностью, пропорциональной размеру, предполагает, что вероятность включения единицы зависит от размера элементов совокупности. При этом значения показателя, характеризующего размер единиц, должны быть известны для каждой единицы совокупности. Обычно показателями размерности являются показатели, которые физически измеряют параметры элемента совокупности. Например, в обследованиях предприятий такой переменной, характеризующей размер единицы, может быть численность занятых или выручка, выпуск, оборот; в обследованиях школ - количество учеников.

Стратифицированная (расслоенная) выборка предполагает разбиение целевой совокупности на непересекающиеся подсовокупности, которые называются стратами. Они могут считаться отдельными совокупностями, из которых элементы отбираются независимо друг от друга. Отбор из страты осуществляется в соответствии с методами отбора (простой случайный отбор, систематический отбор, отбор, пропорциональный размеру наблюдаемых единиц). Если в каждом слое берут простую случайную выборку, то способ отбора в целом называется расслоенным случайным отбором.

Кластерная (многоступенчатая) выборка предполагает, что единицы наблюдения объединены в группы или кластеры (естественным образом). Например, в школе - классы, в квартале - домохозяйства. При одноступенчатой кластерной (или гнездовой) выборке наблюдению подлежат все элементы в отобранных кластерах. Двухступенчатая кластерная выборка предполагает извлечение выборки наблюдаемых единиц из отобранных кластеров.

Многофазная выборка - выборка элементов, сформированная в результате выполнения нескольких этапов отбора. При этом совокупность единиц, отобранных на данном этапе является подсовокупностью единиц, отобранных на предыдущем этапе отбора. Таким образом, извлекается выборка из выборки. Многофазная выборка применяется в частности тогда, когда основная или базовая информация собирается на основе единиц предварительной выборки большого объема, а дополнительная детализированная информация собирается от единиц, извлеченных из предварительной выборочной совокупности.