Числовые характеристики одномерных и двумерных случайных величин

Содержание

Слайд 2

Характеристики двумерной случайной величины (ξ, η) – это характеристики одномерных величин

Характеристики двумерной случайной величины (ξ, η) – это характеристики одномерных величин

ξ и η, и характеристики связи между ними. Дальше мы будем рассматривать именно статистическую связь, которая называется корреляцией. Вначале рассмотрим линейную связь и ее характеристики – ковариацию, коэффициент корреляции, уравнение линейной регрессии, остаточную дисперсию.

Характеристики двумерной случайной величины

Слайд 3

Ковариация Определение. Ковариацией случайной величины (ξ, η) называется центральный смешанный момент

Ковариация

Определение. Ковариацией случайной величины (ξ, η) называется центральный смешанный момент второго

порядка
Kξ,η = cov(ξ, η) = M[(ξ – Mξ)∙(η – Mη)].
Ковариация есть мера линейной зависимости между ξ, η.
Слайд 4

Ковариация Величины ξ,η называются некоррелированными при cov(ξ, η) = 0, положительно

Ковариация

Величины ξ,η называются
некоррелированными при cov(ξ, η) = 0,
положительно

коррелированными при cov(ξ, η) > 0,
отрицательно коррелированными при cov(ξ, η) < 0.
Для вычисления ковариации часто используют формулу
cov(ξ, η) = M(ξ∙η) – M ξ∙M η.
Слайд 5

Коэффициент корреляции Определение. Коэффициентом корреляции между случайными величинами ξ, η называется число

Коэффициент корреляции

Определение. Коэффициентом корреляции между случайными
величинами ξ, η называется число

Слайд 6

Свойства коэффициента корреляции 1. │ρξη│≤ 1. 2. Если ξ,η независимы, то

Свойства коэффициента корреляции

1. │ρξη│≤ 1.
2. Если ξ,η независимы, то ρξη= 0.

Если │ρξη│=1, то ξ, η линейно зависимы,
то есть существуют такие a и b, что
ξ = aη + b.
Слайд 7

Смысл коэффициента корреляции Коэффициент корреляции есть мера линейной зависимости между ξ,

Смысл коэффициента корреляции

Коэффициент корреляции есть мера линейной зависимости между ξ,

η.
Его модуль указывает на силу линейной связи
(чем ближе к 1, тем сильнее),
а знак указывает на направление связи.
Слайд 8

Пример: ρ = +0,9

Пример: ρ = +0,9

Слайд 9

Пример : ρ = +0,2

Пример : ρ = +0,2

Слайд 10

Пример: ρ = – 0,6

Пример: ρ = – 0,6

Слайд 11

Линейная зависимость Проблема: найти функцию, описывающую линейную зависимость (уравнение прямой).

Линейная зависимость

Проблема: найти функцию, описывающую линейную зависимость (уравнение прямой).

Слайд 12

Уравнение линейной регрессии Определение. Уравнением линейной регрессии η на ξ называется

Уравнение линейной регрессии

Определение. Уравнением линейной регрессии η на ξ называется уравнение


ηˆ = aξ + b, параметры которого минимизируют остаточную дисперсию
S2ост= M (η – ηˆ)2 = M(η – (aξ + b))2.
Смысл. Уравнение линейной регрессии η на ξ
выражает линейную зависимость η от ξ.
Слайд 13

Надо найти минимум остаточной дисперсии S2ост= M (η – ηˆ)2

Надо найти минимум остаточной дисперсии
S2ост= M (η – ηˆ)2

Слайд 14

Нахождение коэффициентов уравнения линейной регрессии S2ост = M[η – (aξ+b)]2 =

Нахождение коэффициентов уравнения линейной регрессии

S2ост = M[η – (aξ+b)]2 =
M[(η

– Mη) – a(ξ – Mξ) + (Mη – aMξ – b)]2 =
M(η – Mη)2 + a2M(ξ – M ξ)2 + M[(Mη – aMξ – b)]2 –
2aM[(η – Mη)(ξ – Mξ)] + 2M[(η – Mη)(Mη – aMξ – b)] – 2aM[(ξ – Mξ)(Mη – aMξ – b)].
Слайд 15

(Mη – aMξ – b) – постоянная величина, ее можно вынести

(Mη – aMξ – b) – постоянная величина, ее можно вынести

за знак матожидания.
M(η – Mη) = Mη – M[Mη] = Mη – Mη = 0,
M(ξ – M ξ) = 0
Подставляя, получаем:
S2ост = M(η – Mη)2 + a2M(ξ – M ξ)2 +
+ (Mη – aMξ – b)2 – 2aM[(η – Mη)(ξ – Mξ)].
Слайд 16

Поскольку M(η – Mη)2 = Dη = σ2η, M(ξ – M

Поскольку M(η – Mη)2 = Dη = σ2η,
M(ξ – M

ξ)2 = Dξ = σ2ξ,
M[(ξ – Mξ)∙(η – Mη)] = cov(ξ,η) = ρσξση, то
S2ост = σ2η+ a2σ2ξ + (Mη – aMξ – b)2 – 2a ρσξση.
Слайд 17

S2ост – функция переменных a и b, надо найти min S2ост

S2ост – функция переменных a и b, надо найти min

S2ост , то есть найти значения
a и b, при которых достигается минимум.
Найдем производные от S2ост по a и b.
Слайд 18

S2ост = σ2η+ a2σ2ξ + (Mη – aMξ – b)2 –

S2ост = σ2η+ a2σ2ξ + (Mη – aMξ – b)2 –

2a ρσξση.

(S2ост)'b= –2(Mη – aMξ – b) = 0
(S2ост)'a = 2aσ2ξ – 2Mξ (Mη – aMξ – b) –
–2ρσξση = 0
Из первого уравнения находим:
b = Mη – aMξ.
Подставляя во второе, получаем:
a = ρ∙ση/σξ.

Слайд 19

Подставим a = ρ∙ση/σξ, b = Mη – aMξ В уравнение

Подставим
a = ρ∙ση/σξ, b = Mη – aMξ
В уравнение ηˆ=

aξ+b.
Получим:
ηˆ= ρ∙ση/σξ∙ ξ + Mη – ρ∙ση/σξ ∙ Mξ, или
Слайд 20

Замечание Коэффициент уравнения линейной регрессии ρ∙ση/σξ можно записать в виде: ρ∙ση/σξ

Замечание

Коэффициент уравнения линейной регрессии ρ∙ση/σξ можно записать в виде:
ρ∙ση/σξ = cov(ξ,η)/σ2ξ.
Тогда

уравнение линейной регрессии примет вид:
Слайд 21

Остаточная дисперсия Найдем значение S2ост = M(η – ηˆ)2 = M(η

Остаточная дисперсия

Найдем значение S2ост = M(η – ηˆ)2 = M(η –

(aξ+b))2. Для этого подставим полученные значения a и b.
S2ост = M(η – (aξ + b))2 = M(η – (aξ + b))2=
M[η – Mη – ρ∙ση/σξ(ξ – M ξ)]2 = M(η –Mη)2 +
(ρ∙ση/σξ)2 M(ξ – M ξ)]2 –2 ρ∙ση/σξ M[(ξ – Mξ)∙
(η – Mη)] = σ2η+ (ρ∙ση/σξ)2σ2ξ –
2 ρ∙ση/σξ ∙ ρσξση =
Слайд 22

σ2η + (ρ∙ση)2 – 2 ρ2∙ση2 = σ2η – ρ2∙ση2 =

σ2η + (ρ∙ση)2 – 2 ρ2∙ση2 = σ2η – ρ2∙ση2 =
=

σ2η (1 – ρ2).
Смысл: остаточная дисперсия выражает ошибку приближения при замене η на ηˆ= aξ+b.

Остаточная дисперсия

Слайд 23

Пример Дискретная двумерная случайная величина (X,Y) задана таблицей распределения:

Пример

Дискретная двумерная случайная величина (X,Y) задана таблицей распределения:

Слайд 24

Пример Найдем одномерные законы распределения:

Пример

Найдем одномерные законы распределения:

Слайд 25

Пример Вычислим числовые характеристики. MX = 0∙0,5 + 1∙0,2 + 2∙0,3

Пример

Вычислим числовые характеристики.
MX = 0∙0,5 + 1∙0,2 + 2∙0,3 =

0,8.
DX = 02∙0,5 + 12∙0,2 + 22∙0,3 – 0,82 = 0,76.
MY = ( –1)∙0,3 + 0∙0,4 + 3∙0,3 = 0,6.
DY = ( –1)2∙0,3 + 02∙0,4 + 32∙0,3 – 0,62 = 2,64.
M(XY) = ( –1)∙2∙0,2 = – 0,4.
Слайд 26

Пример Найдем ковариацию: cov(ξ, η) = M(ξ∙η) – M ξ∙ M

Пример

Найдем ковариацию:
cov(ξ, η) = M(ξ∙η) – M ξ∙ M η.
В

наших обозначениях
cov(X, Y) = M(X∙Y) – MX∙ MY.
cov(X,Y) = – 0,4 – 0,8∙0,6 = – 0,88.
Величины X,Y отрицательно коррелированы.
Слайд 27

Коэффициент корреляции

Коэффициент корреляции

Слайд 28

Уравнение линейной регрессии Запишем уравнение линейной регрессии Y на X. Подставим

Уравнение линейной регрессии
Запишем уравнение линейной регрессии Y на X.
Подставим MX =

0,8, DX = 0,76, MY = 0,6. cov(X,Y) = – 0,88.
Yˆ – 0,6 = – 0,88/0,76∙(X – 0,8).
Слайд 29

Остаточная дисперсия Yˆ – 0,6 = – 1,16(X – 0,8). Yˆ=

Остаточная дисперсия

Yˆ – 0,6 = – 1,16(X – 0,8).
Yˆ= – 1,16X

+1,53.
Найдем остаточную дисперсию:
S2ост.= σ2Y (1 – ρ2).
S2ост.= 2,64∙(1 –0,642) ≈ 1,56.
Слайд 30

График линейной регрессии Yˆ= – 1,16X + 1,53.

График линейной регрессии

Yˆ= – 1,16X + 1,53.

Слайд 31

Нелинейная зависимость Проблема: найти функцию, описывающую нелинейную зависимость.

Нелинейная зависимость

Проблема: найти функцию, описывающую нелинейную зависимость.

Слайд 32

Условные распределения Пусть (ξ, η) – двумерная случайная величина. Рассмотрим распределение

Условные распределения

Пусть (ξ, η) – двумерная случайная величина. Рассмотрим распределение η

при условии, что ξ = x. Оно называется условным.
Слайд 33

Условные распределения η при разных значениях ξ.

Условные распределения η при разных значениях ξ.

Слайд 34

Способы нахождения условных распределений в дискретном случае Рассмотрим пример. Пусть дискретная

Способы нахождения условных распределений в дискретном случае

Рассмотрим пример. Пусть дискретная двумерная

случайная величина (X, Y) задана таблицей:
Слайд 35

Пример Найдем условный закон распределения Y/X = 0:

Пример

Найдем условный закон распределения Y/X = 0:

Слайд 36

Действительно, P(Y = –1/X = 0) = P(Y = –1, X

Действительно,
P(Y = –1/X = 0) = P(Y = –1, X

= 0)/P(X = 0) т.к. по формуле условной вероятности,
P(A/B) = P(AB)/P(B).
P(Y = –1,X = 0) =0,1
P(X =0) = 0,5.
Отсюда P(Y= –1/X = 0) = 0,1: 0,5 = 1/5.
Аналогично P(Y = 0/X=0) = 0,1: 0,5 = 1/5,
P(Y = 3/X = 0) = 0,3: 0,5 =3/5.
Слайд 37

Найдем другие условные законы. Условный закон распределения Y/X = 1:

Найдем другие условные законы.
Условный закон распределения Y/X = 1:

Слайд 38

Такой закон распределения записывается в виде ряда распределения

Такой закон распределения записывается в виде ряда распределения

Слайд 39

Условный закон распределения Y/X=2:

Условный закон распределения Y/X=2:

Слайд 40

Условное математическое ожидание Определение. Условным математическим ожиданием случайной величины η при

Условное математическое ожидание

Определение. Условным математическим ожиданием случайной
величины η при условии,

что ξ = x,
называется математическое ожидание, найденное с помощью условного закона распределения.
Обозначение: M(η/ξ = x).
Слайд 41

Замечание Условное математическое ожидание обладает свойствами математического ожидания .

Замечание

Условное математическое ожидание обладает свойствами математического ожидания .

Слайд 42

Условное математическое ожидание

Условное математическое ожидание

Слайд 43

Вспомним предыдущий пример. Найдем условное матожидание Y/X=0: M(Y/X=0)= (–1)∙1/5 + 0∙1/5 + 3∙3/5 = 8/5

Вспомним предыдущий пример.

Найдем условное матожидание Y/X=0:
M(Y/X=0)= (–1)∙1/5 + 0∙1/5 +

3∙3/5 = 8/5
Слайд 44

Аналогично, условные матожидания M(Y/X=1) = 0∙1 =0, M(Y/X=2) = (–1)∙2/3 + 0∙1/3 = –2/3.

Аналогично, условные матожидания
M(Y/X=1) = 0∙1 =0,
M(Y/X=2) = (–1)∙2/3 + 0∙1/3

= –2/3.
Слайд 45

Регрессия Определение. Регрессией η на ξ называется случайная величина r(ξ), равная

Регрессия

Определение. Регрессией η на ξ называется случайная величина r(ξ), равная при

каждом x условному математическому ожиданию случайной величины η при условии, что ξ = x. Определение. Линией регрессии называется линия y = r(x), где
r(x) = M(η/ξ = x).
Слайд 46

Пример В условиях предыдущего примера регрессия Y на X равна:

Пример

В условиях предыдущего примера регрессия Y на X равна:

Слайд 47

Другой способ записи регрессии

Другой способ записи регрессии

Слайд 48

Слайд 49

Корреляционное отношение Определение. Корреляционным отношением η на ξ называется числовая характеристика, равная

Корреляционное отношение

Определение. Корреляционным отношением η на ξ называется числовая характеристика, равная


Слайд 50

Свойства корреляционного отношения 1. 0 ≤ θ2η,ξ ≤ 1. 2. θ2η,ξ

Свойства корреляционного отношения

1. 0 ≤ θ2η,ξ ≤ 1.
2. θ2η,ξ ≥ ρ2.
3.

θ2η,ξ = ρ2 ↔ r(ξ) = aξ+b (т.е., линейная зав–ть).
4. θ2η,ξ = 0 ↔ r(ξ) = Mη (r(ξ)=const, нет связи).
5. θ2η,ξ = 1 ↔ η = r(ξ) (т.е., функц–я зав–ть).
Слайд 51

Смысл: корреляционное отношение измеряет силу зависимости η от ξ

Смысл: корреляционное отношение измеряет силу зависимости η от ξ

Слайд 52

Пример. Чтобы найти θ2YX, надо сначала найти MY и DY. Мы

Пример.

Чтобы найти θ2YX, надо сначала найти MY и DY.
Мы их недавно

находили с помощью одномерного закона.
Слайд 53

MY = ( –1)∙0,3 + 0∙0,4 + 3∙0,3 = 0,6. DY

MY = ( –1)∙0,3 + 0∙0,4 + 3∙0,3 = 0,6.
DY

= ( –1)2∙0,3 + 02∙0,4 + 32∙0,3 – 0,62 = 2,64.
Слайд 54

Смысл полученного числа: корреляционное отношение измеряет силу зависимости Y от X.

Смысл полученного числа: корреляционное отношение измеряет силу зависимости Y от X.

Чем

ближе к 1, тем связь сильнее, чем ближе к 0, тем слабее.
Напоминание: корреляционное отношение принимает значения от 0 до 1.
Если надо найти θ2XY, а не θ2YX , то в формуле надо поменять местами X и Y.
Слайд 55

Условные распределения Определение. Условной функцией распределения случайной величины η при условии,

Условные распределения

Определение. Условной функцией распределения случайной величины
η при условии, что

ξ = x, называется
Fη/ξ = x = P(η < y/ξ = x).
Слайд 56

Условная плотность Определение. Если условная функция распределения случайной величины η при

Условная плотность

Определение. Если условная функция распределения случайной величины η при условии,

что ξ = x, непрерывна, то производная от нее называется условной плотностью распределения случайной величины η при условии, что ξ = x.
Слайд 57

Обозначается условная плотность fη/ξ = x(y) (плотность распределения η в точке

Обозначается условная плотность
fη/ξ = x(y)
(плотность распределения η в точке y при

условии, что ξ = x).
Слайд 58

Нахождение условной функции распределения Условная функция распределения случайной величины η при условии, что ξ = x

Нахождение условной функции распределения

Условная функция распределения случайной величины η при

условии, что ξ = x
Слайд 59

Нахождение условной плотности распределения Условная плотность распределения сл. в. η при условии, что ξ = x

Нахождение условной плотности распределения

Условная плотность распределения сл. в. η при условии,

что ξ = x
Слайд 60

Поскольку

Поскольку

Слайд 61

Числовые характеристики многомерных случайных величин Определение. Ковариационной матрицей случайных величин ξ1,

Числовые характеристики многомерных случайных величин

Определение. Ковариационной матрицей случайных величин ξ1, ξ2

, …, ξn называется матрица K размерности n x n с элементами aij, равными ковариациям cov(ξi, ξj) = kij.
K= (kij)n x n = (cov(ξi, ξj)) n x n
Слайд 62

Ковариационная матрица К

Ковариационная матрица К

Слайд 63

Корреляционная матрица R Наряду с ковариационной матрицей рассматривают и матрицу R,

Корреляционная матрица R

Наряду с ковариационной матрицей рассматривают и матрицу R, составленную

из коэффициентов корреляции ρij = ρ(ξi, ξj).
Слайд 64

Уравнение множественной линейной регрессии Рассмотрим случайные величины ξ0 ξ1, ξ2 ,

Уравнение множественной линейной регрессии

Рассмотрим случайные величины
ξ0 ξ1, ξ2 ,

…, ξn
с математическими ожиданиями Mξi = ai,
с дисперсиями Dξi = σ2i,
i = 0,1,…, n,
и c корреляционной матрицей R размерности (n+1) х (n+1).
Слайд 65

Определение. Уравнением линейной регрессии ξ0 на ξ1, ξ2 , …, ξn называется уравнение

Определение. Уравнением линейной регрессии ξ0 на ξ1, ξ2 , …, ξn

называется уравнение
Слайд 66

Здесь bi (i =1,…, n) – параметры, минимизирующие остаточную дисперсию

Здесь bi (i =1,…, n) – параметры, минимизирующие остаточную дисперсию

Слайд 67

Минимизируя остаточную дисперсию, получаем, что

Минимизируя остаточную дисперсию, получаем, что

Слайд 68

Остаточная дисперсия Здесь и далее через Rij обозначено алгебраическое дополнение элемента

Остаточная дисперсия

Здесь и далее через Rij обозначено алгебраическое дополнение элемента

aij матрицы R, а через |R| – определитель матрицы R.
Остаточная дисперсия равна
Слайд 69

Частный коэффициент корреляции Частный коэффициент корреляции используется как мера линейной зависимости

Частный коэффициент корреляции

Частный коэффициент корреляции используется как мера линейной зависимости между

двумя какими –либо случайными величинами за вычетом влияния остальных случайных величин.