Математическая статистика

Содержание

Слайд 2

Математическая статистика - наука, выявляющая закономерности повторяющихся случайных явлений на основе

Математическая статистика - наука, выявляющая закономерности повторяющихся случайных явлений на основе

обработки статистических данных, полученных в результате наблюдений.
Слайд 3

Основные задачи мат. статистики: 1. Разработка методов анализа наблюдаемых случайных данных

Основные задачи мат. статистики:
1. Разработка методов анализа наблюдаемых случайных данных (

оценка неизвестной вероятности события, неизвестной функции распределения и ее параметров, оценка зависимостей от случайных величин и т.д., проверка статистических гипотез);
2. Синтез алгоритмов для решения задач выявления взаимосвязей, трендов, прогнозирования, поддержки принятия решений.
Слайд 4

Определения. Генеральная совокупность – все множество имеющихся наблюдений или объектов, относящихся к изучаемому явлению.

Определения.
Генеральная совокупность – все множество имеющихся наблюдений или объектов, относящихся

к изучаемому явлению.
Слайд 5

Выборка – набор наблюдений или объектов, случайно отобранных из генеральной совокупности.

Выборка – набор наблюдений или объектов, случайно отобранных из генеральной совокупности.
Объем

генеральной совокупности N и объем выборки n – число наблюдений или объектов в рассматриваемых совокупностях
Слайд 6

Виды выборки Повторная – каждый отобранный объект перед выбором следующего возвращается

Виды выборки

Повторная – каждый отобранный объект перед выбором следующего возвращается

в генеральную совокупность;
Бесповторная – отобранный объект в генеральную совокупность не возвращается.
Слайд 7

NB! Выборка должна быть репрезентативной (представительной).

NB!
Выборка должна быть репрезентативной (представительной).

Слайд 8

Пусть с.в. Х принимает в выборке значение х1 n1 раз, х2

Пусть с.в. Х принимает в выборке значение х1 n1 раз, х2

– n2 раз, …, хк – nк раз, причем
n – объем выборки.

Тогда наблюдаемые значения случайной величины х1,х2,…,хк называют наблюдениями, а n1, n2,…, nк – частотами.
Относительные частоты


Слайд 9

Статистический ряд

Статистический
ряд

Слайд 10

Пример. При проведении 20 бросков игральной кости число выпадений очков оказалось

Пример.
При проведении 20 бросков игральной кости число выпадений очков оказалось равным

2, 2, 5, 1, 2, 3, 2, 3, 3, 1, 5, 4, 4, 2, 1, 3, 2, 3, 6, 4.
Статистический ряд имеет вид:
Слайд 11

Определение. Последовательность наблюдений, записанных в порядке возрастания или убывания х(1), х(2),…,

Определение.
Последовательность наблюдений, записанных в порядке возрастания или убывания
х(1), х(2),…, х(к):


х(1)<= х(2)<=… <= х(к) или убывания
х(1), х(2),…, х(к): х(1) >= х(2)>=… >= х(к)
называют вариационным рядом.
Слайд 12

Определение. Наблюдения, образующие вариационный ряд х(1), х(2),…, х(к), называются порядковыми статистиками,

Определение.
Наблюдения, образующие вариационный ряд
х(1), х(2),…, х(к),
называются
порядковыми статистиками,
а их

номера в вариационном ряду – рангами.
Слайд 13

ВОПРОС 30: Группированные данные

ВОПРОС 30:

Группированные данные

Слайд 14

Статистический ряд для непрерывной с.в.

Статистический ряд
для непрерывной с.в.

Слайд 15

Полигон частот: ломаная, отрезки которой соединяют точки с координатами (x1, p1*), (x2, p2*),…, (xk, pk*) x

Полигон частот:

ломаная, отрезки которой соединяют точки с координатами
(x1, p1*),

(x2, p2*),…, (xk, pk*)

x

Слайд 16

Выборочная функция распределения и гистограмма ВОПРОС 31:

Выборочная функция распределения и гистограмма

ВОПРОС 31:

Слайд 17

Определение. Выборочной (эмпирической) функцией распределения называют функцию F*(x), определяющую для каждого

Определение.
Выборочной (эмпирической) функцией распределения называют функцию F*(x), определяющую для каждого

значения х относительную
частоту события X < x:
Слайд 18

Слайд 19

Слайд 20

Свойства F*(x) (совпадают со свойствами F(x)): 1. 0 ≤ F*(x) ≤

Свойства F*(x)
(совпадают со свойствами F(x)):

1. 0 ≤ F*(x) ≤ 1.
2.

F*(x) – неубывающая функция.
Если х1 – наименьшее наблюдение,
то F*(x) = 0 при х≤ х1;
если хк – наибольшее наблюдение,
то F*(x) = 1 при х > хк
Слайд 21

Эмпирическая плотность распределения которая в интервале ( Xi-1, Xi ] постоянна и равна

Эмпирическая плотность
распределения

которая в интервале ( Xi-1, Xi ] постоянна и

равна
Слайд 22

Гистограмма

Гистограмма

Слайд 23

ВОПРОС 32: Оценки параметра положения: выборочное среднее, оценки моды и медианы

ВОПРОС 32:

Оценки параметра положения: выборочное среднее, оценки моды и медианы

Слайд 24

ОПРЕДЕЛЕНИЯ. Выборочное среднее:

ОПРЕДЕЛЕНИЯ.

Выборочное среднее:

Слайд 25

Мода: Медиана:

Мода:

Медиана:

Слайд 26

ВОПРОС 33: Оценки параметра масштаба: оценки дисперсии, начальных и центральных моментов

ВОПРОС 33:

Оценки параметра масштаба:
оценки дисперсии, начальных и центральных моментов

Слайд 27

ОПРЕДЕЛЕНИЯ. Выборочной дисперсией называется

ОПРЕДЕЛЕНИЯ.

Выборочной дисперсией
называется

Слайд 28

Центральный эмпирический момент: Начальный эмпирический момент:

Центральный эмпирический момент:

Начальный эмпирический момент:

Слайд 29

Пример 1. Найти числовые характеристики выборки

Пример 1.

Найти числовые характеристики выборки

Слайд 30

Слайд 31

ВОПРОС 34: Свойства оценок

ВОПРОС 34:

Свойства оценок

Слайд 32

Схема: k выборок одного и того же объема n и вычислим

Схема: k выборок одного и того же объема n и вычислим

для каждой из них оценку параметра Θ:
Слайд 33

Слайд 34

Определение. Оценка некоторого признака называется АСИМПТОТИЧЕСКИ НЕСМЕЩЕННОЙ, если для выборки х1, х2, …, хп

Определение. Оценка некоторого признака называется АСИМПТОТИЧЕСКИ НЕСМЕЩЕННОЙ, если для выборки х1,

х2, …, хп
Слайд 35

Определение. Статистическая оценка называется ЭФФЕКТИВНОЙ, если она при заданном объеме выборки n имеет наименьшую возможную дисперсию

Определение. Статистическая оценка называется ЭФФЕКТИВНОЙ, если она при заданном объеме выборки

n имеет наименьшую возможную дисперсию
Слайд 36

Определение. СОСТОЯТЕЛЬНОЙ называется статистическая оценка, которая при стремится по вероятности к оцениваемому параметру :

Определение. СОСТОЯТЕЛЬНОЙ называется статистическая оценка, которая при

стремится по вероятности

к оцениваемому параметру :
Слайд 37

Теорема. Выборочное среднее представляет собой несмещенную оценку математического ожидания E(Х). Доказать самостоятельно!

Теорема.
Выборочное среднее представляет собой несмещенную оценку математического ожидания E(Х).
Доказать

самостоятельно!
Слайд 38

Выборочное дисперсия представляет собой смещенную оценку дисперсии:

Выборочное дисперсия представляет собой смещенную оценку дисперсии:

Слайд 39

Исправленная выборочная дисперсия:

Исправленная
выборочная дисперсия:

Слайд 40

Исправленное среднее квадратическое отклонение

Исправленное
среднее квадратическое
отклонение

Слайд 41

Определение. Оценка некоторого признака называется асимптотически несмещенной, если для выборки х1, х2, …, хn

Определение. Оценка некоторого признака называется асимптотически несмещенной, если для выборки х1,

х2, …, хn
Слайд 42

СПОСОБЫ ПОСТРОЕНИЯ ОЦЕНОК

СПОСОБЫ ПОСТРОЕНИЯ ОЦЕНОК

Слайд 43

ВОПРОС 35: Метод максимального правдоподобия

ВОПРОС 35:

Метод максимального правдоподобия

Слайд 44

Модель. ] Х – дискретная с.в., которая в результате п испытаний

Модель. ] Х – дискретная с.в., которая в результате п испытаний

приняла значения х1, х2, …, хп.
Предположим, что нам известен закон распределения этой величины, определяемый параметром Θ, но неизвестно численное значение этого параметра. Найдем его точечную оценку.
] р(хi, Θ) – вероятность того, что в результате i-го испытания величина Х примет значение хi.
Слайд 45

Определение. Назовем функцией правдоподобия дискретной случайной величины Х функцию аргумента Θ,

Определение. Назовем функцией правдоподобия дискретной случайной величины Х функцию аргумента Θ,

определяемую по формуле:
L (х1, х2, …, хп; Θ) = =p(x1,Θ)p(x2,Θ) … p(xn,Θ).

L (х1, х2, …, хп; Θ) = f(x1,Θ)f(x2,Θ)…f(xn,Θ).

Слайд 46

Определение. Оценкой наибольшего правдоподобия называется оценка при котором функция правдоподобия достигает

Определение. Оценкой наибольшего правдоподобия называется оценка

при котором функция правдоподобия

достигает максимума:

ln L – логарифмическая функция правдоподобия.

Слайд 47

Алгоритм поиска ММП-оценки: ММП-оценки состоятельны (хотя могут быть смещенными), распределены асимптотически

Алгоритм поиска ММП-оценки:

ММП-оценки состоятельны (хотя могут быть смещенными), распределены асимптотически

нормально и имеют наименьшую дисперсию по сравнению с другими асимптотически нормальными оценками.
Слайд 48

ВОПРОС 36: Метод моментов

ВОПРОС 36:

Метод моментов

Слайд 49

] известный вид п.р. f(x, Θ1, Θ2 ) определяется двумя неизвестными

] известный вид п.р. f(x, Θ1, Θ2 ) определяется двумя неизвестными

параметрами Θ1 и Θ2.
Требуется составить два уравнения, например Θ1 = М1, Θ2 = т2.
Отсюда

Решениями будут точечные оценки
Θ1 = ψ1 (х1, х2, …, хп),
Θ2 = ψ2(х1, х2, …, хп).

Слайд 50

ВОПРОС 37: Метод наименьших квадратов

ВОПРОС 37:

Метод
наименьших квадратов

Слайд 51

…)

…)

Слайд 52

Пример: y=ax+b

Пример: y=ax+b

Слайд 53

Слайд 54

ВОПРОС 38: Байесовский подход к получению оценок

ВОПРОС 38:

Байесовский подход
к получению оценок

Слайд 55

](Y, X) – случайный вектор, для которого известна плотность р(Y|x) .

](Y, X) – случайный вектор,
для которого известна плотность р(Y|x) .

Для

оценки некоторой заданной функции φ(х) в качестве ее приближенного значения предлагается искать условное математическое ожидание E( φ‌‌(х) ‌‌|Y), вычисляемое по формуле

где

Слайд 56

ДВУМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

ДВУМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

Слайд 57

ВОПРОС 39: Двумерные случайные величины

ВОПРОС 39:

Двумерные
случайные величины

Слайд 58

Определение. Двумерной случайной величиной называют систему из двух случайных величин для

Определение.

Двумерной случайной величиной называют систему из двух случайных величин

для

которой определена вероятность

совместного выполнения неравенств

Слайд 59

Определение. Функция двух переменных определенная для любых x и y, называется

Определение.

Функция двух переменных

определенная для любых x и y, называется

функцией распределения системы двух случайных величин
Слайд 60

Пример

Пример

Слайд 61

ДИСКРЕТНАЯ ДВУМЕРНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА Определение. Двумерная случайная величина называется дискретной, если - дискретные величины.

ДИСКРЕТНАЯ ДВУМЕРНАЯ
СЛУЧАЙНАЯ ВЕЛИЧИНА

Определение.

Двумерная случайная величина

называется дискретной, если


- дискретные величины.

Слайд 62

Слайд 63

Табличная форма задания двумерной случайной величины. Пример /

Табличная форма задания
двумерной случайной величины.
Пример

/

Слайд 64

Определение. Две дискретные случайные величины называются независимыми, если

Определение.

Две дискретные случайные величины

называются независимыми, если

Слайд 65

Пример.

Пример.

Слайд 66

НЕПРЕРЫВНАЯ ДВУМЕРНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА Определение. Двумерная случайная величина называется непрерывной, если

НЕПРЕРЫВНАЯ ДВУМЕРНАЯ
СЛУЧАЙНАЯ ВЕЛИЧИНА

Определение.

Двумерная случайная величина

называется непрерывной, если

Слайд 67

Определение. Функция называется плотностью распределения вероятностей системы двух величин

Определение.

Функция

называется плотностью
распределения вероятностей
системы двух величин

Слайд 68

Пример:

Пример:

Слайд 69

Слайд 70

Для независимых с.в.

Для независимых с.в.

Слайд 71

Слайд 72

Отсюда

Отсюда

Слайд 73

Аналогично:

Аналогично:

Слайд 74

Пример

Пример

Слайд 75

Определение. Двумерная случайная величина распределена нормально, если плотность распределения системы имеет вид:

Определение.

Двумерная случайная величина распределена нормально, если плотность распределения системы имеет

вид:
Слайд 76

Для независимых с.в.

Для независимых с.в.

Слайд 77

ВОПРОС 40: Числовые характеристики двумерных случайных величин

ВОПРОС 40:

Числовые
характеристики
двумерных случайных
величин

Слайд 78

Определение. Начальным моментом порядка (k, s) двумерной случайной величины (Х, Y) называется

Определение.

Начальным моментом порядка (k, s) двумерной случайной величины (Х, Y)

называется
Слайд 79

Определение. Центральным моментом порядка (k, s) двумерной случайной величины (Х, Y) называется

Определение.

Центральным моментом порядка (k, s) двумерной случайной величины (Х, Y)

называется
Слайд 80

При этом E(Х) = α1,0, E(Y) = α0,1, D(X) = μ2,0, D(Y) = μ0,2.

При этом E(Х) = α1,0, E(Y) = α0,1,
D(X) =

μ2,0, D(Y) = μ0,2.
Слайд 81

ВОПРОС 41: Корреляционный момент и коэффициент корреляции

ВОПРОС 41:

Корреляционный
момент и
коэффициент
корреляции

Слайд 82

Определение. Корреляционным моментом системы двух случайных величин называется второй смешанный центральный

Определение.

Корреляционным моментом системы двух случайных величин называется второй смешанный центральный

момент

Kxy = μ1,1 = E((X – EX)(Y – EY)).

Слайд 83

Слайд 84

Безразмерной характеристикой коррелированности двух случайных величин является коэффициент корреляции Определение.

Безразмерной характеристикой коррелированности двух случайных величин является коэффициент корреляции

Определение.

Слайд 85

Для независимых Х и Y f(x =f1(x)f2(y), тогда Теорема.

Для независимых Х и Y f(x =f1(x)f2(y), тогда

Теорема.

Слайд 86

Доказательство


Доказательство

Слайд 87

ВОПРОС 44: Статистическое описание и вычисление характеристик двумерного случайного вектора

ВОПРОС 44:

Статистическое
описание и вычисление
характеристик
двумерного
случайного вектора

Слайд 88

Двумерная выборка представляет собой набор значений случайного вектора: (х1, у1), (х2,

Двумерная выборка представляет собой набор значений случайного вектора:
(х1, у1), (х2,

у2), …, (хn, уn).

Дескриптивный статистический анализ: