Первичная статистическая обработка результатов измерений случайной величины

Содержание

Слайд 2

6.1. Основные понятия Математическая статистика занимается статистическим анализом результатов опытов или

6.1. Основные понятия
Математическая статистика занимается статистическим анализом результатов опытов или наблюдений,

а также построением и проверкой подходящих моделей процессов и систем на основе результатов экспериментов.
Слайд 3

Статистический анализ и построение вероятностных моделей процессов и систем основаны на

Статистический анализ и построение вероятностных моделей процессов и систем основаны на

том, что измеряемые в процессе опыта или наблюдений физические (или иного смысла) величины Х, характеризующие исследуемый процесс или систему, при повторении опытов подвержены некоторому неконтролируемому разбросу х1, х2,…, хn.
Этот разброс обусловлен действием случайных неучтенных факторов и ошибками измерений.
Слайд 4

Поэтому величина Х рассматривается как одномерная случайная величина, а результаты измерения

Поэтому величина Х рассматривается как одномерная случайная величина, а результаты измерения

х1, х2,…, хn этой величины, называемые в математической статистике ее основными признаками – как эмпирическая реализация этого математического понятия.
Совокупность всех мыслимых значений, которые может принимать величина Х при данном реальном комплексе условий, называют генеральной совокупностью.
Слайд 5

Распределение признака Х в генеральной совокупности совпадает с теоретическим распределением вероятностной

Распределение признака Х в генеральной совокупности совпадает с теоретическим распределением вероятностной

величины Х. Последнее называется распределением генеральной совокупности, а его параметры – параметрами генеральной совокупности.
Генеральная совокупность может быть конечной (всего N мыслимых наблюдений) и бесконечной в зависимости от того, конечна или бесконечна совокупность всех мыслимых значений.
Слайд 6

Выборка из данной генеральной совокупности – это результаты ограниченного ряда наблюдений

Выборка из данной генеральной совокупности – это результаты ограниченного ряда наблюдений


х1, х2,…, хn значений случайной величины Х.
На практике при исследовании мы чаще всего имеем дело с выборками, поскольку обследование всей генеральной совокупности бывает слишком трудоемко (когда n – достаточно большое число), либо принципиально невозможно (в случае бесконечной генеральной совокупности).
Слайд 7

Число n наблюдений, образующих выборку, называют объемом выборки. Таким образом, вместо

Число n наблюдений, образующих выборку, называют объемом выборки.
Таким образом, вместо

большой совокупности объектов изучается совокуп-
ность объёма, значительно меньшего по количеству объектов (n << N).
Результаты, полученные при изучении выборки, распространяются на объекты всей генеральной совокупности. Для этого выборка должна быть репрезентативной (представительной), то есть правильно представлять генеральную совокупность.
Слайд 8

Это обеспечивается случайностью отбора. Виды отбора: 1) простой случайный: – повторный;

Это обеспечивается случайностью отбора.
Виды отбора:
1) простой случайный:

повторный;
– бесповторный;
2) сложный случайный:
– типический;
– механический;
– серийный.
Слайд 9

Простой случайный отбор – производится без деления генеральной совокупности на части.

Простой случайный отбор – производится без деления генеральной совокупности на части.


Повторный отбор – отобранный объект возвращается в генеральную совокупность.
Бесповторный отбор – отобранный объект не возвращается в генеральную
совокупность.
Сложный случайный отбор – производится после предварительного деления генеральной совокупности на части.
Слайд 10

Типический отбор – генеральная совокупность делится на типы, из каждого типа

Типический отбор – генеральная совокупность делится на типы, из каждого
типа

случайно отбираются объекты пропорционально объёму типов.
Механический отбор – генеральная совокупность делится на части механически, из каждой части случайно отбираются объекты.
Серийный отбор – генеральная совокупность делится на серии, и случайным
образом отбираются целые серии объектов.
Слайд 11

Разность между наибольшим и наименьшим значениями xi (i=1,…, n) из выборки

Разность между наибольшим и наименьшим значениями xi (i=1,…, n) из выборки

называется размахом выборки.
Взаимно независимые случайные величины имеют одинаковые распределения, а, следовательно, и одинаковые числовые характеристики (математическое ожидание, дисперсию и т.д.)
Слайд 12

Основные задачи математической статистики: 1. Определение закона распределения основного признака (наблюдаемой

Основные задачи математической статистики:
1. Определение закона распределения основного признака (наблюдаемой СВ);
2.

Нахождение оценок неизвестных параметров распределений и оценок числовых характеристик СВ;
3. Проверка правдоподобия статистических гипотез;
4. Оптимальная организация и проведение экспериментов, и оптимальная обработка результатов эксперимента.
Слайд 13

6.2.Статистическое распределение выборки Наблюдаемые значения xi (i=1,…,n) называют вариантами, а последовательность

6.2.Статистическое распределение выборки
Наблюдаемые значения xi (i=1,…,n) называют вариантами, а последовательность значений

(вариант), записанных в возрастающем порядке – вариационным рядом.
Числа наблюдений ni называют частотами, а их отношения к объему выборки ni / n = pi* - относительными частотами.
Слайд 14

Статистическим распределением выборки называют перечень вариант xi и соответствующих им частот

Статистическим распределением выборки называют перечень вариант xi и соответствующих им частот

ni или относительных частот pi*.
При больших объемах выборки n статистическое распределение выборки становится недостаточно наглядным. В этом случае статистические данные представляются в виде интервального вариационного ряда, который носит название статистического ряда.
Слайд 15

Построение статистического ряда: размах выборки разбивается на q конечных (или бесконечных)

Построение статистического ряда:
размах выборки разбивается на q конечных (или бесконечных) интервалов

Xj-0,5ΔXj< xi< Xj+0,5ΔXj, длины которых (размахи) соответственно hj=Δ Xj , а середины интервалов Xj , где j=1,…,q.
2. Количество интервалов выбирается в основном из практических соображений. В частности, рекомендуется, чтобы значение q было не менее 5-10 и более 20-25 и в каждом интервале должно быть не менее 10 значений.
Слайд 16

3. В том случае, если полученные из опыта данные группируются вокруг

3. В том случае, если полученные из опыта данные группируются вокруг

некоторых значений, то желательно, чтобы эти значения не находились вблизи узлов разбиения интервалов. Затем, подсчитываются число значений выборки nj, попавших в интервал.
Если данные попадают на границы интервалов, то их либо распределяют равномерно по двум соседним интервалам, либо относят только к одному из них (например, к левому).
Слайд 17

Выбор количества интервалов существенно зависит от объема выборки. Существуют такие рекомендации

Выбор количества интервалов существенно зависит от объема выборки. Существуют такие рекомендации

по использованию формулы Старджеса
q=log2n+1≅3,32ln n + 1
или других формул, например:
q≅5 lg n, q≅ .
Все эти формулы следует рассматривать как нижнюю оценку.
Слайд 18

Так как длина интервала hj может быть большой, а количество численных

Так как длина интервала hj может быть большой, а количество численных

значений nj, попавших в него, сравнительно малым, то для сопоставления групп друг с другом вычисляется также величина
,
называемая плотностью относительной частоты.
Слайд 19

Полученные результаты сводятся в таблицу вида:

Полученные результаты сводятся в таблицу вида:

Слайд 20

6.3.Полигон частот и гистограмма Полигоном частот называют ломанную линию, отрезки которой

6.3.Полигон частот и гистограмма
Полигоном частот называют ломанную линию, отрезки которой соединяют

точки (x1,n1), (x2,n2), …, (xn,nn).
Слайд 21

Для построения полигона частот на оси абсцисс откладывают варианты xi, а

Для построения полигона частот на оси абсцисс откладывают варианты xi, а

по оси ординат – соответствующие им частоты ni. Точки (xi, ni) соединяют отрезками прямых и получают полигон частот.
Слайд 22

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (x1,р*1), (x2,р*2), …, (xn,р*n).

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (x1,р*1), (x2,р*2),

…, (xn,р*n).
Слайд 23

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат

интервалы длиною hj=ΔXj, а высоты равны отношению
nj / hj (плотность частоты). Площадь j-го прямоугольника равна nj – сумме частот j-го интервала. Следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.
Слайд 24

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых

служат частичные интервалы длиною hj = ΔXj, а высоты равны отношению р*j / hj (плотность относительной частоты). Площадь j-го частичного прямоугольника равна р*j – сумме относительных частот j-го интервала. Следовательно, площадь гистограммы относительных частот равны сумме всех относительных частот, т.е. единице.
Слайд 25

Слайд 26

6.4. Эмпирические функции распределения Эмпирической функцией распределения (функцией распределения выборки) называют

6.4. Эмпирические функции распределения

Эмпирической функцией распределения (функцией распределения выборки) называют функцию

F*(x), определяющей для каждого значения х частоту события X
Слайд 27

Из т. Бернулли следует, что при неограниченном увеличении n относительная частота

Из т. Бернулли следует, что при неограниченном увеличении n относительная частота

события X < x, т.е. F*(x) стремится по вероятности к F(x) этого события, т.к.
Эмпирическая (статистическая) функция распределения выборки используется для приближенной оценки теоретической (интегральной) функции распределения генеральной совокупности.
Слайд 28

Это подтверждается тем, что F*(x) обладает всеми свойствами F(x): 1) значения

Это подтверждается тем, что F*(x) обладает всеми свойствами F(x):
1) значения эмпирической

функции принадлежат отрезку [0;1];
2) F*(x) – неубывающая функция;
3) если x1 – наименьшая варианта, то F*(x)=0 при х4) если x2 – наибольшая варианта, то F*(x)=1 при х≥x2.