Статистический анализ зависимостей между гидрологическими переменными (лекция 10)

Содержание

Слайд 2

Статистический анализ зависимостей между гидрологическими переменными Задача: Найти вид зависимости y

Статистический анализ зависимостей между гидрологическими переменными

Задача: Найти вид зависимости y =

f(x1, x2, …xk)
где у - зависимая переменная (или предиктант)
x1, x2, …xk – независимые переменные (предикторы)
Допустим для простоты, что у зависит только от одного предиктора, т.е. y = f(x) и что зависимость y = f(x) является линейной
Искомым уравнением регрессии в этом случае будет выражение
yi = axi +b
Слайд 3

Метод наименьших квадратов Нужно определить такие значения параметров a и b,

Метод наименьших квадратов

Нужно определить такие значения параметров a и b,

при которых сумма квадратов отклонений наблюденных значений уi от рассчитанных по вышеприведенной формуле будет иметь минимальное значение.
Сумма квадратов отклонений равна

Чтобы сумма стала минимальной частные производные по параметрам a и b должны равняться нулю.

Слайд 4

Метод наименьших квадратов Решая эти уравнения относительно a и b, получим

Метод наименьших квадратов

Решая эти уравнения относительно a и b, получим

- средние

значения Х и У

и

a - коэффициент регрессии. Он равен

σу и σх - среднеквадратические отклонения выборок из Y и X
r – выборочный коэффициент парной корреляции, определяемый по формуле

Существует связь между коэффициентом корреляции и параметрами регрессии

Слайд 5

Метод наименьших квадратов r - эмпирическая мера линейной зависимости между Y

Метод наименьших квадратов

r - эмпирическая мера линейной зависимости между Y и

X, изменяется от -1 до +1. При знаке «+» - зависимость прямая, а при знаке «-« - обратная
Коэффициент корреляции можно рассчитать по формуле

с учетом того, что

уравнение регрессии можно представить в виде

Слайд 6

Линеаризация нелинейных зависимостей Зависимость y = f(x) может иметь и нелинейных

Линеаризация нелинейных зависимостей

Зависимость y = f(x) может иметь и нелинейных вид
В

этом случае, можно попытаться использовать для аппроксимации зависимости y = f(x) уравнение экспоненты

где а и с - эмпирические параметры
Метод наименьших квадратов позволяет определить параметры и в случае нелинейной модели. Можно существенно упростить расчеты, проведя линеаризацию исходного выражения.
Прологарифмировав обе части получим

ln(y) = ln(с) + ax

Обозначим у и х в виде у’ = ln(y); x’ = x. С учетом этого перепишем выражение выше y’ = ax’ + b, где b = ln (c)
Теперь уравнение стало линейным и для оценки a и b можно использовать подход, который использовался в первом случае.
После того как параметры найдены, проводят обратное преобразование. В данном случае: с = eb

Слайд 7

Преобразования, применяемые при линеаризации зависимостей

Преобразования, применяемые при линеаризации зависимостей

Слайд 8

Оценка точности уравнения линейной регрессии для двух переменных Обычно в гидрологии

Оценка точности уравнения линейной регрессии для двух переменных

Обычно в гидрологии

регрессионная зависимость может использоваться для практических расчетов, если |r| ≥ 0.7 
Другие статистические характеристики, позволяющие судить о точности полученного уравнения
σy(x) – стандартная ошибка уравнения линейной регрессии. Эта величина характеризует среднеквадратическое отклонение точек от принятой линии регрессии.

уi – наблюденная величина

- величина, рассчитанная по уравнению регрессии

n-2 - число степеней свободы.
Число степеней свободы равно числу наблюдений минус число параметров, определяемых по эмпирическим данным. В данном случае таких параметров два: коэффициент регрессии а и свободный член – b.

Слайд 9

Оценка точности уравнения линейной регрессии для двух переменных σy(x) через коэффициент

Оценка точности уравнения линейной регрессии для двух переменных

σy(x) через коэффициент корреляции

можно записать

где σy*- несмещенная оценка СКО для ряда Y
Иногда при практических расчетах пренебрегают величиной

и используют более простую формулу

Слайд 10

Оценка точности уравнения линейной регрессии для двух переменных σr - стандартная

Оценка точности уравнения линейной регрессии для двух переменных

σr - стандартная ошибка

коэффициента парной корреляции

σа – стандартная ошибка коэффициента регрессии

Выражение для σа можно представить также в виде

где σх* и σу* - оценки СКО соответственно для Х и Y

Слайд 11

Оценка точности уравнения линейной регрессии для двух переменных σb – стандартная

Оценка точности уравнения линейной регрессии для двух переменных

σb – стандартная ошибка

свободного члена

или это выражение еще можно записать как

Для практических расчетов можно рекомендовать следующие соотношения, при которых можно использовать уравнения регрессии

Желательное, но необязательное условие