Ошибки статистического наблюдения

Как уже отмечалось выше, одним из критериев качества статистических данных является их достоверность. Уровень достоверности связан с количеством ошибок, которые могут возникнуть в процессе статистического производства; чем больше количество ошибок, тем ниже достоверность.

Оценка ошибки измеряемого параметра совокупности включает в себя как ошибку выборки, которая возникает из-за того, что наблюдается только часть, а не вся генеральная совокупность, так и ошибки, не связанные с выборкой, и представляет собой разницу между оценкой и истинным значением параметра.

Для всех типов статистического наблюдения ошибки, не связанные с выборкой, возникают при планировании, сборе и обработке данных, расчете конечных оценок. Ошибки, не связанные с выборкой, могут возникнуть из-за целого комплекса проблем, например, ошибок, которые допустил исследователь или интервьюер, неточностей ответов респондентов, концептуальных или логических ошибок, отклонений в процессе редактирования, кодирования, классификации и анализа данных.

Классификация ошибок при планировании наблюдения, сборе и обработке статистических данных представлена на схеме ниже.

┌────────────────┐

│ Общая ошибка │

└────────────────┘

/ \

/ \

/ \

/ \

┌─────────────────────────────┐ ┌───────────────────────────────────────┐

│ Ошибка выборки │ │ Ошибка, не связанная с выборкой │

│ (обусловливается методом │ └───────────────────────────────────────┘

│ формирования выборки и │

│ оценивания) │ ┌───────────────────────────────────────┐

└─────────────────────────────┘ │ Ошибки при планировании обследования: │

│ - ошибки, вызванные плохим качеством │

│ основы выборки (неохват, перехват, │

│ неправильная классификация) │

│ │

│ Ошибки при сборе данных │

│ - ошибки измерения │

│ - ошибки, связанные с отсутствием │

│ ответов │

│ │

│ Ошибки при обработке данных: │

│ - ошибки кодирования │

│ - ошибки редактирования │

└───────────────────────────────────────┘

Ошибки, возникающие при планировании статистического наблюдения, прежде всего, вызваны плохим качеством основы выборки. Ошибки, возникающие при сборе статистических данных, делятся на ошибки измерения и ошибки, связанные с отсутствием ответов. Ошибки измерения возникают в данных статистического наблюдения из-за: метода сбора статистических данных, умышленных или неумышленных ошибок респондента или интервьюера, инструментария статистического наблюдения, информационной системы, хода проведения интервью. Данная ошибка включает:

ошибку в ответе наблюдения - как результат затруднения, незнания, небрежности или нечестности респондента;

ошибку (присущую интервьюерам), являющуюся следствием плохого или неадекватного обучения, предварительно ожидаемой оценки ответа респондента или преднамеренных ошибок;

ошибку, относящуюся к формулировке и контексту вопросов формы, порядку, в котором они представлены, или методу, используемому для получения ответа.

Ошибки, связанные с отсутствием ответов, возникают вследствие невозможности получить ответ на вопрос статистического наблюдения.

Неответы являются причиной увеличения дисперсии оценки из-за уменьшения объема выборки и/или применения методов замещения данных. При этом существуют как полные, так и частичные неответы. Полный неответ представляет собой полное отсутствие в файле с первичными данными результатов обследования по единице наблюдения. Частичный неответ - отсутствие данных не в целом по единице наблюдения, а лишь по конкретным пунктам вопросника.

Ошибки, возникающие при обработке статистических данных, могут возникать на всех стадиях обработки: кодировании, редактировании, взвешивании, агрегировании и т.д.