Научная электронная библиотека
Монографии, изданные в издательстве Российской Академии Естествознания

6.1.1. Метод наименьших квадратов

До сих пор мы рассматривали измерения той или иной физической величины, находящейся при проведении всей серии измерений в неизменном состоянии. Однако бывают случаи, когда сама измеряемая величина за время измерений меняется вследствие непостоянства другой величины, связанной с ней (например, отклонения от прямолинейной функции «оптическая плотность раствора – высокие концентрации раствора). И в этих случаях будет наблюдаться статистический разброс, приводящий к случайным погрешностям. Но этот разброс будет уже проходить не относительно неизменного “истинного” значения или среднего значения измеряемой величины, как обычно рассматривалось ранее, а относительно изменяющегося (например, вследствие изменения времени или температуры) «истинного» значения.

Пусть в результате эксперимента мы получили ряд измерений величины yy1, y2, ..., yn, соответствующих значениям аргумента t1, t2, ...,tn, которые могут быть представлены на графике в виде точек (t1, y1), (t2, y2), ..., (tn, yn) (рис. 6.1), и нам необходимо установить эмпирическую зависимость между y и t (Приложения II, III).  Если последовательно соединить все эти точки, то получим ломаную линию, которая ничего общего не будет иметь с искомой зависимостью y = f(t). Это следует из того, что форма этой ломаной линии не будет воспроизводиться при повторных сериях измерений. Измеренные значения yi будут в общем случае смещены  относительно искомой кривой y = f(t) как в сторону больших, так и в сторону меньших значений вследствие статистического разброса (рис. 6.2).

Задача в данном случае состоит в том, чтобы по данным экспериментальным точкам провести кривую (не ломаную линию), которая проходила бы как можно ближе к истинной функциональной зависимости y = f(t). Теория вероятности показывает, что наилучшим приближением будет такая кривая (или прямая) линия, для которой сумма квадратов расстояний по вертикали от точек до кривой будет минимальной.

Рис. 6.1. Положения экспериментальных значений (ti,yi)

Рис. 6.2. Кривая y = y(t), построенная по значениям (ti,yi) методом  наименьших квадратов

Как известно, этот метод и называется методом наименьших квадратов. Думается, что читателям, занимающимся химическими науками, представит интерес сущность этого метода.

Предположим, что искомая зависимость выражается функцией y = f(t,А12, ...,Аn), где А12, ...,Аn - параметры.

Значения этих параметров определяются так, чтобы точки yi располагались по обе стороны кривой y = f(t) как можно ближе к последней, т.е. чтобы сумма квадратов отклонений измеренных значений yi от функции y = f(t) была бы наименьшей. Это соответствует предположению, что разброс точек yi относительно кривой y = f(t) подчиняется закону нормального распределения.

Как отмечается в литературе по математической статистике, мерой этого разброса является дисперсия s2 или ее приближенное выражение - средний квадрат отклонений (при малой выборке)

DSn2 = (1/n)×S[yj - y(tj)]2 = (1/n)×S[yj - f(tj)]2 = (1/n)×SDyj*2,

и требование минимального разброса соответствует требованию минимального значения этого среднего квадрата.

Как известно, функция f(A) принимает минимальное значение при А = Аmin , если ее первая производная f¢(A) = df/dA  равна нулю, а вторая производная f¢¢(A) = d2f/dA2 положительна, при этом значения A = Amin. Для функции многих переменных эти условия заменяются требованием, чтобы частные производные, то есть  производные по параметру Ai, удовлетворяли вышеупомянутым условиям, причем все остальные параметры Aj(j¹ i) при вычислении производных считаются постоянными.

Таким образом, из условий минимума получаем систему уравнений для определения наилучших значений параметров:

 DSn2/Ai = -(2/n)×S[yj - f(tj)][f(tj)]/Ai = 0  (6.1)

  (i = 1, 2, ..., mm< n)

Обычно форму зависимости f(t,А12, ...,Аn) задают в виде полинома:

 f(t) = A0 + A1(t) + ... + Amtm = SAiti  (6.2)

(i = 0,1,..., m);  [m < (n-1)]

или в виде любой другой системы линейно независимых функций j1(t):

 f(t) = A1j1(t)+ A2j2(t)+ ... + Amjm(t)= SAiji(t)  (6.3)

(i = 1,2,... m);  (m< n),

достаточно хорошо передающей общий ход зависимости y = f(t), который можно установить по расположению точек (ti, yi) на рис. 6.1.

В случае выбора f(t,А12, ...,Аn) уравнение (6.2) принимает вид:

DSn2/Ai = -(2/n)×S[yj - SАk tjk)tj = 0

(k = 0,1, ..., m;  i = 0, 1, 2, ..., m; m < n-1),

т.е.

S(yj - S Аk tjk)tj = 0

(k = 0, 1, ..., m;  i = 1, 2, ..., n)

или 

SAk Stj(k+i) = Syjtji  (6.4) 

(k = 0,1,..., mj = 1, 2, ..., ni = 0, 1,...,mm + < n).

В случае выбора разложения f(t,А12, ...,Аm) в форме (6.3) уравнение (6.2) принимает вид:

DSn2/Ai = -(2/n)×S[yj - SАkjk(tj)]ji(tj) = 0

(k = 1,2,... m;  j = 1, 2, ..., n; m < n),

т.е.

S[yj - SАkjk(tj)]ji(tj) = 0  (k = 1,2,... m; j = 1,2,...n)

или 

 SAkSjk(tj)ji(tj)= Syjji(tj)  (6.5)

(k =1,2,...,mj =1,2,...,ni =1,2,...,mm< n)

Решение этих систем линейных уравнений позволяет однозначно определить коэффициенты Ai  разложения y = f(t).


Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674