Документ утратил силу или отменен. Подробнее см. Справку

Приложение 13. Удаление выбросов

Приложение 13

УДАЛЕНИЕ ВЫБРОСОВ

Удаление выбросов производится с использованием стандартных

процедур математической статистики. В частности, для удаления

выбросов может быть использована процедура, базирующаяся на

критерии Смирнова-Граббса. Значения рыночных цен x (или значения

i

некоторого фактора стоимости) упорядочиваются по возрастанию,

образуя вариационный ряд. Критерий Смирнова-Граббса основан на

-

|x - x|

| i |

вычислении максимального относительного отклонения ----------, где

s

n

x - крайний (минимальный x(1) или максимальный x(n)) элемент

i - 1 n

вариационного ряда, x = - SUMx - среднее по выборке,

n i=1 i

-----------------

/ 1 n - 2

s = /----- SUM(x - x) - выборочное среднеквадратическое

n / n-1 i=1 i

\/

отклонение (СКО). Для малых выборок в вычисляемые значения

относительных отклонений вводится уточняющий множитель

1

-------------, в результате чего формулы для вычисления

-----------

\/(n - 1) / n

относительных отклонений принимают вид:

- -

x - x x - x

(1) (n)

T = ---------- - для минимального и T = ---------- -

(1) s (n) s

для максимального значений вариационного ряда;

--

/2 2 1 n - 2

s = /s , s = - SUM(x - x) - дисперсия эмпирического

\/ n i=1 i

распределения.

Значения T и T сравниваются с критическим значением

(1) (n)

C метода Смирнова-Граббса. Выборка не содержит грубых

альфа

погрешностей, если T <= C , i = 1; n, где - выбранный

(i) альфа

уровень значимости. Табличные значения C для разных уровней

альфа

значимости содержатся в специальных статистических таблицах.

Критерий Смирнова-Граббса рассчитан на определение единичных выбросов, этот критерий может дать "сбой" при наличии нескольких близких выбросов на том или ином конце вариационного ряда. Для определения таких групп выбросов используется критерий Титьена-Мура, который состоит в следующем.

Для k максимальных значений исследуемой характеристики x из исходной выборки проверяется статистика:

N-k - 2

SUM(x - x )

- i=1 i k

L = --------------,

k N - 2

SUM(x - x)

i=1 i

N-k

SUMx

- i=1 i -

где x = -------, а x - среднее значение характеристики x на

k N-k

всей выборке.

Для k минимальных значений исследуемой характеристики x из исходной выборки проверяется статистика:

N 2

SUM (x - x )

i=k+1 i -k

L = ----------------,

-k N - 2

SUM(x - x)

i=1 i

где

N

SUM x

i=k+1 i

x = ---------

-k N - k.

_

Если значения статистик L или L окажутся меньше критического

k -k

значения L , для заданного уровня значимости альфа, то

альфа

соответствующие "хвосты" характеристики x относят к грубым

выбросам. Критические значения L также содержатся в

альфа

специальных статистических таблицах.