V. Алгоритм формирования типической выборки

Предлагается следующий порядок построения типических выборок промышленных организаций:

1. Рассчитываются статистические характеристики ряда для каждой основы выборки (таблица 4).

-

Среднее значение выручки по i-му виду деятельности (X )

i

N

i

SUM X

- u i,u

X = --------,

i N

i

где X - выручка u-й организации по i-му виду деятельности;

i,u

N - число промышленных организаций региона по i-му виду

i

деятельности (исключаются организации с нулевым значением

выручки).

┌ ┐2

N │N │

i 2 │ i │

SUM X │SUM X │

2 2 u i,u │ u i,u│

Дисперсия (сигма ) сигма = -------- - │--------│.

i i N │ N │

i │ i │

└ ┘

Среднее квадратическое отклонение (сигма )

i

/--------------------

/ ┌ ┐2

/N │N │

/ i 2 │ i │

/ SUM X │SUM X │

/ u i,u │ u i,u│

сигма = / -------- - │--------│.

i / N │ N │

/ i │ i │

V └ ┘

Минимальное значение выручки по i-му виду деятельности

(X ).

i,min

Максимальное значение выручки по i-му виду деятельности

(X ).

i,max

Коэффициент вариации в % (V )

i

сигма

i

V = ------ х 100.

i -

X

i

2. Каждая основа выборки разбивается на типические (однородные

группы).

Разбивка на типические группы проводится путем

последовательного бинарного деления упорядоченного ряда по средней

на группы:

-

а) меньше среднего значения показателя (< X ),

i

-

б) больше среднего значения показателя (> X ).

i

Ранжированный ряд по i-му виду деятельности делится на две

группы:

а) значение показателя (X ) меньше или равно среднему значению

i

- -

(X ), т.e. X <= X ;

i i i

-

б) значение показателя (X ) превышает среднее значение (X ),

i i

-

т.е. X > X .

i i

Для групп а) и б) рассчитываются статистические характеристики:

- 2 - 2

(N , X , сигма , сигма , V ), (N , X , сигма , сигма , V ).

a a a a a b b b b b

В результате расчетов возможны два результата:

1) коэффициент вариации равен 33% или менее 33%; в этом случае

группа считается однородной и может быть использована в качестве

типической группы;

2) коэффициент вариации больше 33%; тогда необходимо

повторение той же операции, т.е. каждая из групп N и N делится

a b

на две подгруппы:

- -

а) X меньше или равно X , т.е. X <= Х ;

i i i i

- -

б) Х больше X , т.е. X > X .

i i i i

Затем рассчитываются статистические характеристики для каждой

из полученных подгрупп:

- 2 - 2

(N , X , сигма , сигма , V ), (N , X , сигма ,

a,a a,a a,a a,a a,a a,b a,b a,b

сигма , V ),

a,b a,b

- 2 - 2

(N , X , сигма , сигма , V ), (N , X , сигма ,

b,a b,a b,a b,a b,a b,b b,b b,b

сигма , V ).

b,b b,b

Опять возможны два результата:

1) коэффициент вариации меньше или равен 33%;

2) коэффициент вариации больше 33%.

Операция повторяется до того момента, пока вся генеральная

совокупность (N ) не будет разделена на группы, коэффициенты

i

вариации (V ) в которых не будут превышать 33%. Дробление

i

прекращается в том случае, когда численность группы (N ) будет

i,j

равна или меньше 10 единиц, независимо от величины коэффициента

вариации.

3. По сформированным группам, у которых коэффициент вариации

(V ) равен или меньше 33%, строится интервальный ряд и

i - 2

рассчитывается средняя из внутригрупповых дисперсий (сигма ) по

i

i-му виду деятельности (таблица 5).

k 2

SUM сигма х N

- 2 1 i,j i,j

сигма = -------------------,

i N

i

2

где сигма - дисперсия j-й типической группы по i-му виду

i,j

деятельности;

N - количество организаций в генеральной совокупности j-й

i,j

типической группы по i-му виду деятельности;

N - количество организаций в генеральной совокупности по i-му

i

виду деятельности;

k - число типических групп.

4. Рассчитывается объем выборки (n ) по i-му виду деятельности

i

с заданным уровнем точности (относительная предельная ошибка

выборки эта = 5%, эта = 10%, эта = 15%) (таблица 6).

1 2 3

2 - 2

t x сигма x N

i i

n = --------------------------,

i 2 - 2 2

t x сигма + дельта x N

i i i

где t - квантиль стандартного нормального распределения,

соответствующий доверительной вероятности р; при р = 0,955, t =

1,96;

дельта - заданная абсолютная предельная ошибка выборки по

i

i-му виду деятельности

-

эта x X

i i

ДЕЛЬТА = ----------,

i 100

эта - заданная относительная предельная ошибка выборки по

i

i-му виду деятельности.

5. Проводится анализ для определения приемлемого объема

выборочной совокупности в зависимости от необходимого уровня

точности, числа обследуемых организаций и допустимых финансовых

затрат.

При этом суммарный расчетный объем выборки (n + n + ... +

1 2

n ) по всем видам деятельности не должен превышать 30% от числа

m

промышленных организаций региона.

6. Объем выборочной совокупности (отобранной в результате

анализа) размещается в типических группах пропорционально

численности организаций (таблица 7).

n x N

i i,j

n = ---------,

i,j j

SUM N

1 i,j

где n - количество отобранных организаций в j-й типической

i,j

группе по i-му виду деятельности.

7. Осуществляется отбор единиц наблюдения из типической

группы. Для этого рассчитывается шаг отбора (h ) для каждой j-й

i,j

группы по i-му виду деятельности (таблица 7)

N

i,j

h = ----.

i,j n

i,j

Промышленные организации отбираются в соответствии с шагом

отбора в каждой j-й группе.

Началом отбора в j-й типической группе является организация,

находящаяся в середине первого интервала отбора этой группы

(а ).

i,j

h h h

i,j i,j i,j

a = ----, a = ---- + h , a = ---- + h + h ,

1i,j 2 2i,j 2 i,j 3i,j 2 i,j i,j

...,

h

i,j

a = ---- + h + ... + h ,

ni,j 2 i,j i,j

где h - шаг отбора в каждой j-й типической группе по i-му виду

i,j

деятельности.