Элементы теории вероятностей и математической статистики

Содержание

Слайд 2

IV. 0. Элементы ТВ и МС Cтатистический (стохастический) эксперимент - эксперимент,

IV. 0. Элементы ТВ и МС

Cтатистический (стохастический) эксперимент -
эксперимент, результат которого

заранее неизвестен.
Лежит в основе теории вероятностей и математической
статистики.
Проводится по определенному плану
Цель эксперимента - выявить закономерности случайных
явлений, процессов.
Результат эксперимента - случайные величины (СВ),
дискретные или непрерывные, определенные на всей
числовой оси или на некотором интервале.
Для определения СВ необходимо знать как СВ, так и ее
вероятность p, значение которой лежит в пределах
0 <= p <=1
Слайд 3

IV. 0. Элементы ТВ и МС Случайная величина и ее вероятность

IV. 0. Элементы ТВ и МС

Случайная величина и ее вероятность связаны

функциями:
1. Зависимость между значениями случайной величины и
соответствующими вероятностями называется:
- Для непрерывной случайной величины - плотность
распределения f(x)
- Для дискретной случайной величины- закон распределения -
2. Функция распределения F(x) – вероятность того, что
случайная величина меньше некоторого значения Х
Между функциями f(x) и F(x) существует связь
Вероятность попадания непрерывной случайной величины
X в заданный интервал (a, b) определяется по формуле
Слайд 4

IV. 0. Элементы ТВ и МС Числовые характеристики случайной величины: 1.

IV. 0. Элементы ТВ и МС

Числовые характеристики случайной величины:
1. Меры положения

- математическое ожидание m- среднее центральное
значение, вокруг которого распределены возможные
значения СВ;
для дискретной СВ для непрерывной СВ
- мода Mo- случайная величина, имеющая наибольшую
вероятность;
- медиана Me – случайная величина, расположенная в
середине диапазона, в котором СВ определена.
Для ряда {xi}= {2,3,5,6,7} Me = 5;
Для ряда {xi}= {3,5,6,7} Me = (5 +6)/2 = 5.5
Слайд 5

IV. 0. Элементы ТВ и МС 2. Меры разброса - дисперсия

IV. 0. Элементы ТВ и МС

2. Меры разброса
- дисперсия D–

математическое ожидание квадрата отклонения
СВ от ее математического ожидания
для дискретной СВ для непрерывной СВ
- среднеквадратическое отклонение
- размах R = xmax - xmin
- коэффициент вариации (ковариация) - отношение
выборочного среднеквадратического отклонения к выборочной
средней, выраженное в процентах.
Ковариация характеризует однородность совокупности
При V < 33% - совокупность считается количественно однородной


Слайд 6

IV. 0. Элементы ТВ и МС 3. Меры формы. Функция плотности

IV. 0. Элементы ТВ и МС

3. Меры формы. Функция плотности распределения

f(x) может
быть: - симметричной или ассиметричной;
- крутовершинной или плосковершинной;
- одномодальной или полимодальной.
Для оценки формы графика функции f(x) вводятся меры
формы : - коэффициент асимметрии As и эксцесс E
Для нормального закона распределения (закона Гаусса)
коэффициенты As и E равны нулю
Асимметрией теоретического распределения называют
характеристику, которая определяется формулой
Эксцессом теоретического распределения -
характеристика, которая определяется формулой
Слайд 7

1.1. Нормальный закон распределения (Гаусса) Плотность распределения Функция распределения При нормировке

1.1. Нормальный закон распределения (Гаусса)

Плотность распределения Функция распределения
При нормировке (стандартное нормальное

распределение)
На интервале [-3σ;+3σ]
Интервал[-3σ;+3σ] является областью статистического допуска
параметра качества
Слайд 8

Нормальное распределение Гаусса

Нормальное распределение Гаусса

Слайд 9

IV. 0. Элементы математической статистики Математическая статистика – раздел математики, в

IV. 0. Элементы математической статистики

Математическая статистика – раздел математики, в
котором

изучаются методы сбора, систематизации, обработки и
анализа результатов наблюдений массовых случайных явлений
для выявления существующих закономерностей.
Первая задача математической статистики - определение
способов сбора и систематизации статистической информации.
Вторая задача математической статистики – разработка
методов обработки и анализа статистических данных
Вторая задача решается в несколько этапов:
Предварительный анализ данных – анализ и исключение грубых ошибок, вычисление параметров (статистик) выборочных данных
Точечные и интервальные оценки параметров модели
Выбор типа модели, описывающей данные эксперимента
Проверка модели о согласии модели и эмпирических данных
Слайд 10

IV.0. Элементы математической статистики Все изучаемые объекты формируют генеральную совокупность (

IV.0. Элементы математической статистики

Все изучаемые объекты формируют генеральную
совокупность ( ГС)

данных. Объем генеральной ГС
обозначают N.
Сплошное обследование – анализ всех данных ГС. Не
всегда возможно – из за большого объема ГС или
необходимости уничтожения объекта.
Обычно из совокупности выбирают ограниченное число
объектов (выборку) и их подвергают изучению, применяют
выборочный метод обследования. Объем выборки
обозначают n
Чтобы по данным выборки можно было уверенно судить об
интересующем нас признаке ГС, необходимо, чтобы объекты
выборки правильно представляли ГС.
Выборка должна быть репрезентативной
(представительной). Для этого каждый из объектов
выборки должен быть отобран из ГС случайным образом.
Существуют специальные приёмы отбора, обеспечивающие
репрезентативность выборки.
Слайд 11

Варианта - наблюдаемое значение количественного признака хi, Вариационный ряд - последовательность

Варианта - наблюдаемое значение количественного признака хi,
Вариационный ряд - последовательность

вариант, записанных в порядке
возрастания
Частота ni, - число наблюдений значения признака хi,
Относительная частота vi - отношение ni к объёму выборки n
Справедливы соотношения
Статистическое (эмпирическое) распределением выборки –
соответствие между вариантами хi , записанными в порядке
возрастания, и относительными частотами vi
Накопленные ( относительные ) частоты - сумма частот (
относительных частот) со значением признака х меньше Х.
Эмпирическая функция распределения - соответствие между вариантами и
накопленными частотами.
Интервальный вариационный ряд - варианты, объединенные в группы.
- В интервальном вариационном ряду К – количество групп, fi –
частоты попадания варианта в i-ую группу, ∑ fi = n
- В интервальном ряду накопленные частоты ( относительные
частоты) показывают сумму частот ( относительных частот) со
значением признака х меньше Х.
Слайд 12

Элементы математической статистики и производственный процесс. Долгосрочная и краткосрочная вариации Производственный

Элементы математической статистики и производственный процесс. Долгосрочная и краткосрочная вариации

Производственный процесс

может отслеживаться в
текущем режиме или течении длительного промежутка
времени. В первом случае наблюдаем краткосрочную
вариацию, во втором – долгосрочную.
Краткосрочная вариация абсолютно случайна, зависит
от большого количества общих причин, является
вариацией по общим причинам.
Долгосрочная вариация содержит информацию о
неслучайных причинах вариаций, это вариация по
особым причинам
Обнаружение особых причин приводит к попытке их
устранения и улучшения характеристик процесса.
Особыми причинами могут быть износ оборудования,
различия в сырье, квалификация персонала и др.
Чтобы обнаружить общие и особые причины, необходимо
запланировать и провести статистический эксперимент, а
затем проанализировать его результаты.
Слайд 13

Существует аналогия между статистическим распределением выборки и законом распределения дискретной случайной

Существует аналогия между статистическим
распределением выборки и законом распределения
дискретной случайной

величины.
В данном случае вместо возможных значений случайной
величины фигурируют варианты, а вместо
соответствующих вероятностей - относительные частоты.
В силу этой аналогии по известному эмпирическому
распределению можно по тем же формулам, что и для
дискретного распределения, найти выборочные аналоги
математического ожидания и дисперсии.
Для оценки числовых параметров выборки и , в
дальнейшем, генеральной совокупности, в
математической статистике используют следующие
числовые характеристики –
статистики или меры процесса:
1. меры положения – средние значения, медиана, мода;
2. меры разброса – размах, выборочная дисперсия, выборочное среднеквадратическое отклонение;
3. меры формы – коэффициент асимметрии, эксцесс
Слайд 14

Графическое представление экспериментальных данных Экспериментальные данные по мере наблюдений заносятся в

Графическое представление экспериментальных данных
Экспериментальные данные по мере наблюдений
заносятся в таблицы

определенной формы.
Для наглядного представления экспериментальных
данных используют графики и диаграммы.
К основным графическим формам отнесены:
1.Точечные диаграммы
2. Гистограммы
3. Диаграммы изменения процесса во времени
4. Диаграммы рассеяния
Наряду с перечисленными, применяют и другие
наглядные средства: полигон, кумулятивная кривая,
диаграммы рассеяния и др.
На следующих слайдах представлены некоторые
графические формы
Слайд 15

Корреляционный, регрессионный, дисперсионный, временной анализ Основная задача корреляционного анализа – выявление

Корреляционный, регрессионный, дисперсионный, временной анализ

Основная задача корреляционного анализа – выявление
связи между

случайными переменными
Основная задача регрессионного анализа – установление
формы связи между случайными переменными
Основная задача дисперсионного анализа - оценка влияния
различных факторов на результат эксперимента.
Дисперсионный анализ применяется и для последующего
планирования экспериментов
Важнейшей задачей исследования временных рядов –
выявление и статистическая оценка основной тенденции
развития изучаемого процесса
Слайд 16

Элементы корреляционного и регрессионного анализа На практике параметры регрессии определяются на

Элементы корреляционного и регрессионного анализа

На практике параметры регрессии определяются на базе

данных
выборочного эксперимента. Графическим представлением
результатов этого эксперимента является корреляционная
диаграмма, поле корреляции, диаграмма рассеяния
Слайд 17

Корреляция. Поле корреляции По виду диаграммы рассеяния можно судить о характере

Корреляция. Поле корреляции

По виду диаграммы рассеяния можно судить о характере и

силе
корреляционной связи. Если удается провести прямую (линию
тренда) через группу точек поля корреляции, то между факторами
имеется линейная связь Плотная группировка точек вокруг прямой
говорит о сильной связи, угол наклона прямой – о направлении
корреляции. При наклоне до 900 увеличение фактора X вызывает
рост фактора Y. Сила корреляционного эффекта зависит от угла
наклона прямой – чем круче линия тренда, тем сильнее фактор X
влияет на фактор Y
Для определения количественной силы связи вычисляют
коэффициент корреляции r . Коэффициент корреляции изменяется
в пределах -1<= r <=1.
При r =0 две случайные величины независимы.
При r >0 наблюдается положительная связь между факторами
(признаками), рост значений одного фактора ведет к росту значений
другого.
При r <0 – связь обратная, рост значений одного фактора приводит к
уменьшению другого.
При Abs (r) = 1 связь функциональная
Слайд 18

Статистическая связь между одним фактором и средним значением другого может быть


Статистическая связь между одним фактором и средним
значением другого может быть

сильной, слабой, отсутствовать.
Уравнение регрессии (линия регрессии) показывает силу
влияния одной характеристики на другую. Чем круче линия
регрессии, тем сильнее влияние одного параметра на другой.
Статистическая связь между одним фактором и средним
значением другого может быть сильной, слабой, отсутствовать.
Уравнение регрессии (линия регрессии) показывает силу
влияния одной характеристики на другую. Чем круче линия
регрессии, тем сильнее влияние одного параметра на другой.