Подготовлена редакция документа с изменениями, не вступившими в силу

4. Расчет и статистическая оценка параметров линейной зависимости

При использовании физических, физико-химических и химических методов анализа для количественного определения веществ непосредственному измерению подвергается некоторая величина y (аналитический сигнал), которая является, как правило, линейной функцией искомой концентрации (количества) x определяемого вещества или элемента. Иными словами, в основе таких методов анализа лежит экспериментально подтвержденная линейная зависимость:

y = bx + a, (4.1);

где: y - измеряемая величина (измеряемое значение аналитического сигнала);

x - концентрация (количество) определяемого вещества или элемента;

b - угловой коэффициент линейной зависимости;

a - свободный член линейной зависимости.

(Здесь b и a рассматривают как коэффициенты (параметры) линейной регрессии y на x).

Для использования зависимости (4.1) в аналитических целях, т.е. для определения конкретной величины x по измеренному значению y, необходимо заранее найти числовые значения констант b и a, т.е. провести калибровку. Иногда константы зависимости (4.1) имеют тот или иной физический смысл, и их значения должны оцениваться с учетом соответствующего доверительного интервала. Если калибровка проведена и значения констант a и b определены, величину xi находят по измеренному значению yi:

00001816.wmz. (4.2)

При калибровке величину x рассматривают как аргумент, а величину y - как функцию. Наличие линейной зависимости между x и y не всегда является очевидным, ее наличие целесообразно подтверждать расчетным путем. Для этого по экспериментальным данным, полученным при калибровке, оценивают достоверность линейной связи между x и y с использованием корреляционного анализа и лишь затем рассчитывают значения констант a и b зависимости (6.1) и их доверительные интервалы. В первом приближении судить о достоверности линейной связи между переменными x и y можно по величине линейного коэффициента корреляции (или просто коэффициента корреляции) r, который вычисляют по формуле, исходя из экспериментальных данных:

00001817.wmz. (4.3)

Линейный коэффициент корреляции r изменяется в пределах от -1 до +1. Положительные значения r указывают на рост, а негативные - на уменьшение y с ростом x.

Линейный коэффициент корреляции r является частным случаем общего индекса корреляции Rc, который применим также и для нелинейных зависимостей между величинами y и x:

00001818.wmz, (4.3а)

где: so - остаточное стандартное отклонение (стандартное отклонение линейной зависимости) (уравнение 4.7);

sy - стандартное отклонение величин у относительно среднего значения 00001819.wmz (4.15); рассчитывают с использованием уравнения (1.5).

Уравнение (4.3а) в силу своей простоты и наглядности нередко используют вместо уравнения (4.3) в том случае, когда знак коэффициента корреляции не имеет значения.

Чем ближе абсолютная величина |r| к единице, тем менее случайна наблюдаемая линейная зависимость между переменными x и y. Коэффициент корреляции r используют обычно для выявления стохастической взаимосвязи между величинами, функциональная зависимость между которыми может и отсутствовать. Коэффициент корреляции является значимым, если его величина для данной вероятности P и числа степеней свободы f превышает значения, приведенные таблице 4 Приложения. В противном случае нельзя говорить о существовании значимых зависимостей (4.1) - (4.2).

Значимость коэффициента корреляции является обязательным, но не достаточным условием использования уравнений (4.1) - (4.2) для аналитических целей. При статистической обработке результатов физического, физико-химического или химического методов анализа лекарственных средств могут быть использованы линейные зависимости с коэффициентом корреляции |r| >= 0,98 (при соответствии требованиям таблицы 4 Приложения), а при анализе следовых количеств определяемых веществ рассматривают линейные зависимости с коэффициентом корреляции |r| >= 0,90. При столь близких значениях величины |r| к единице формальное подтверждение наличия линейной связи между переменными x и y проводить не следует. Вместе с тем необходимо учитывать, что для различных методов анализа лекарственных средств, требования к линейности метода, могут быть различными.

Коэффициенты a и b и другие характеристики линейной зависимости (4.1) рассчитывают с использованием регрессионного анализа, т.е. методом наименьших квадратов по экспериментально измеренным значениям переменной y для заданных значений аргумента x. Пусть в результате эксперимента найдены представленные в таблице 4.-4. пары значений аргумента x и функции y.

Таблица 4.-4. - Значения аргумента x и функции y

i

xi

yi

1

x1

y1

2

x2

y2

...

...

...

m

xm

ym

Тогда, если величины y1 имеют одинаковую неопределенность (а такое допущение обычно выполняется для достаточно узкого диапазона варьирования величин y1), то

00001820.wmz, (4.4)

00001821.wmz, (4.5)

f = m - 2. (4.6)

Если полученные значения коэффициентов a и b использовать для вычисления значений y по заданным в таблице 4.-4. значениям аргумента x согласно зависимости (4.1), то вычисленные значения y обозначают через Y1, Y2, ..., Yi, ... Yn. Разброс значений yi относительно значений Yi характеризует величина остаточной дисперсии 00001822.wmz (дисперсии линейной зависимости), которую вычисляют по формуле:

00001823.wmz. (4.7)

Для того, чтобы уравнения (4.1) - (4.2) адекватно описывали экспериментальные данные, необходимо, чтобы остаточная дисперсия 00001824.wmz не отличалась значимо по критерию Фишера (уравнения (2.1) и (2.2)) от дисперсии прецизионности величин y1. Последняя может быть найдена или спрогнозирована из паспортных данных оборудования.

В свою очередь, дисперсии констант b и a находят по уравнениям:

00001825.wmz; (4.8)

00001826.wmz. (4.9)

Стандартные отклонения sb и sa и величины 00001827.wmz и 00001828.wmz, необходимые для оценки доверительных интервалов констант уравнения регрессии, рассчитывают по уравнениям:

00001829.wmz; (4.10)

00001830.wmz; (4.11)

00001831.wmz; (4.12)

00001832.wmz. (4.13)

Коэффициенты a и b должны значимо отличаться от нуля, т.е. превышать, соответственно, величины 00001833.wmz и 00001834.wmz.

Уравнению (4.1) с константами a и b обязательно удовлетворяет точка с координатами 00001835.wmz и 00001836.wmz, называемая центром калибровочного графика:

00001837.wmz; (4.14)

00001838.wmz. (4.15)

Наименьшие отклонения значений yi от значений Yi наблюдаются в окрестностях центра графика. Стандартные отклонения sy и sx величин y и x, рассчитанных соответственно по уравнениям (4.1) и (4.2), исходя соответственно из известных значений x и y, определяют с учетом удаления последних от центра графика:

00001839.wmz; (4.16)

00001840.wmz, (4.17)

где: 00001841.wmz - среднее значение;

nj - число вариант y, использованных при определении 00001842.wmz.

При 00001843.wmz и 00001844.wmz выражения (4.16) и (4.17) принимают вид:

00001845.wmz; (4.16а)

00001846.wmz. (4.17а)

С учетом значений sy и sx могут быть найдены значения величин 00001847.wmz и 00001848.wmz:

00001849.wmz; (4.18)

00001850.wmz. (4.19)

Значения sx и 00001851.wmz, найденные при nj = 1, являются характеристиками прецизионности аналитической методики, если x - концентрация (количество), а y - функция x.

Обычно результаты статистической обработки по методу наименьших квадратов сводят в таблицу (таблица 4.-5).

Таблица 4.-5. - Результаты статистической обработки экспериментальных данных, полученных при изучении линейной зависимости y = bx + a

f

00001852.wmz

00001853.wmz

b

a

t(P2, f) при P2 = 95%

00001854.wmz

00001855.wmz

00001856.wmz

r

sx при nj = 1, 00001857.wmz

00001858.wmz

00001859.wmz, %

1

2

3

4

5

6

7

8

9

10

11

12

13

Примечания:

1. Если целью экспериментальной работы являлось определение констант b и a, графы 11, 12 и 13 таблицы не заполняют.

2. Если y = b · lgx + a, вычисления, описанные в настоящем разделе, выполняют с использованием уравнений (1.8), (1.9), (1.29) - (1.32).