Научная электронная библиотека

Взаимодействия в растворах электролитов: моделирование сольватационных процессов, равновесий в растворах полиэлектролитов и математическое прогнозирование свойств химических систем

Танганов Б. Б.,

6.1.1. Метод наименьших квадратов

До сих пор мы рассматривали измерения той или иной физической величины, находящейся при проведении всей серии измерений в неизменном состоянии. Однако бывают случаи, когда сама измеряемая величина за время измерений меняется вследствие непостоянства другой величины, связанной с ней (например, отклонения от прямолинейной функции «оптическая плотность раствора – высокие концентрации раствора). И в этих случаях будет наблюдаться статистический разброс, приводящий к случайным погрешностям. Но этот разброс будет уже проходить не относительно неизменного “истинного” значения или среднего значения измеряемой величины, как обычно рассматривалось ранее, а относительно изменяющегося (например, вследствие изменения времени или температуры) «истинного» значения.

Пусть в результате эксперимента мы получили ряд измерений величины y: y₁, y_2, ..., y_n, соответствующих значениям аргумента t₁, t₂, ...,t_n, которые могут быть представлены на графике в виде точек (t₁, y₁), (t₂, y₂), ..., (t_n, y_n) (рис. 6.1), и нам необходимо установить эмпирическую зависимость между y и t (Приложения II, III). Если последовательно соединить все эти точки, то получим ломаную линию, которая ничего общего не будет иметь с искомой зависимостью y = f(t). Это следует из того, что форма этой ломаной линии не будет воспроизводиться при повторных сериях измерений. Измеренные значения y_i будут в общем случае смещены относительно искомой кривой y = f(t) как в сторону больших, так и в сторону меньших значений вследствие статистического разброса (рис. 6.2).

Задача в данном случае состоит в том, чтобы по данным экспериментальным точкам провести кривую (не ломаную линию), которая проходила бы как можно ближе к истинной функциональной зависимости y = f(t). Теория вероятности показывает, что наилучшим приближением будет такая кривая (или прямая) линия, для которой сумма квадратов расстояний по вертикали от точек до кривой будет минимальной.

Рис. 6.1. Положения экспериментальных значений (t_i,y_i)

Рис. 6.2. Кривая y = y(t), построенная по значениям (t_i,y_i) методом наименьших квадратов

Как известно, этот метод и называется методом наименьших квадратов. Думается, что читателям, занимающимся химическими науками, представит интерес сущность этого метода.

Предположим, что искомая зависимость выражается функцией y = f(t,А₁,А₂, ...,А_n), где А₁,А₂, ...,А_n - параметры.

Значения этих параметров определяются так, чтобы точки y_i располагались по обе стороны кривой y = f(t) как можно ближе к последней, т.е. чтобы сумма квадратов отклонений измеренных значений y_i от функции y = f(t) была бы наименьшей. Это соответствует предположению, что разброс точек y_i относительно кривой y = f(t) подчиняется закону нормального распределения.

Как отмечается в литературе по математической статистике, мерой этого разброса является дисперсия s² или ее приближенное выражение - средний квадрат отклонений (при малой выборке)

DS_n² = (1/n)×S[y_j - y(t_j)]² = (1/n)×S[y_j - f(t_j)]² = (1/n)×SDy_j^*2,

и требование минимального разброса соответствует требованию минимального значения этого среднего квадрата.

Как известно, функция f(A) принимает минимальное значение при А = А_min , если ее первая производная f¢(A) = df/dA равна нулю, а вторая производная f¢¢(A) = d²f/dA² положительна, при этом значения A = A_min. Для функции многих переменных эти условия заменяются требованием, чтобы частные производные, то есть производные по параметру A_i, удовлетворяли вышеупомянутым условиям, причем все остальные параметры A_j(j¹ i) при вычислении производных считаются постоянными.

Таким образом, из условий минимума получаем систему уравнений для определения наилучших значений параметров:

DS_n²/A_i = -(2/n)×S[y_j - f(t_j)][f(t_j)]/A_i = 0 (6.1)

(i = 1, 2, ..., m; m< n)

Обычно форму зависимости f(t,А₁,А₂, ...,А_n) задают в виде полинома:

f(t) = A₀ + A₁(t) + ... + A_mt^m = SA_itⁱ (6.2)

(i = 0,1,..., m); [m < (n-1)]

или в виде любой другой системы линейно независимых функций j₁(t):

f(t) = A₁j₁(t)+ A₂j₂(t)+ ... + A_mj_m(t)= SA_ij_i(t) (6.3)

(i = 1,2,... m); (m< n),

достаточно хорошо передающей общий ход зависимости y = f(t), который можно установить по расположению точек (t_i, y_i) на рис. 6.1.

В случае выбора f(t,А₁,А₂, ...,А_n) уравнение (6.2) принимает вид:

DS_n²/¶A_i = -(2/n)×S[y_j - SА_k t_j^k)t_jⁱ = 0

(k = 0,1, ..., m; i = 0, 1, 2, ..., m; m < n-1),

т.е.

S(y_j - S А_k t_j^k)t_jⁱ = 0

(k = 0, 1, ..., m; i = 1, 2, ..., n)

или

SA_k St_j^(k+i) = Sy_jt_jⁱ (6.4)

(k = 0,1,..., m; j = 1, 2, ..., n; i = 0, 1,...,m; m + 1 < n).

В случае выбора разложения f(t,А₁,А₂, ...,А_m) в форме (6.3) уравнение (6.2) принимает вид:

DS_n²/A_i = -(2/n)×S[y_j - SА_kj_k(t_j)]j_i(t_j) = 0

(k = 1,2,... m; j = 1, 2, ..., n; m < n),

т.е.

S[y_j - SА_kj_k(t_j)]j_i(t_j) = 0 (k = 1,2,... m; j = 1,2,...n)

или

SA_kSj_k(t_j)j_i(t_j)= Sy_jj_i(t_j) (6.5)

(k =1,2,...,m; j =1,2,...,n; i =1,2,...,m; m< n)

Решение этих систем линейных уравнений позволяет однозначно определить коэффициенты A_i разложения y = f(t).

Научная электронная библиотека

Монографии, изданные в издательстве Российской Академии Естествознания

6.1.1. Метод наименьших квадратов

Научная электронная библиотека
Монографии, изданные в издательстве Российской Академии Естествознания