Лекция 2. Элементы математической статистики

Содержание

Слайд 2

ПРЕДМЕТ: Анализ экспериментальных данных – значений количествен-ного признака (артериальное давление, пульс).

ПРЕДМЕТ:
Анализ
экспериментальных данных –
значений количествен-ного признака
(артериальное давление, пульс).
Такой признак – случайная

величина.

ЗАДАЧА:
изучить законы
распределения иссле-
дуемых случайных величин,
их характеристики,
проверить ряд гипотез,
установить, есть ли между величинами связь.

Слайд 3

Часть I. БАЗОВЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Часть I.
БАЗОВЫЕ ПОНЯТИЯ
МАТЕМАТИЧЕСКОЙ
СТАТИСТИКИ

Слайд 4

1. ПОНЯТИЯ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ И ВЫБОРКИ ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ – ВСЕ МНОЖЕСТВО

1. ПОНЯТИЯ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ И ВЫБОРКИ

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ – ВСЕ МНОЖЕСТВО ОБЪЕКТОВ,

ОБЛАДАЮЩИХ ДАННЫМ ПРИЗНАКОМ.
ВЫБОРКА – ЧАСТЬ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ.

ЭЛЕМЕНТЫ ВЫБОРКИ – значения изучаемого признака у входящих в выборку объектов.
ОБЪЕМ ВЫБОРКИ N – число элементов в ней.
ВАРИАНТЫ – отличающиеся друг от друга, различные элементы выборки.

Слайд 5

РЕПРЕЗЕНТАТИВНАЯ ВЫБОРКА Чтобы по выборке можно было судить о генеральной совокупности,

РЕПРЕЗЕНТАТИВНАЯ ВЫБОРКА

Чтобы по выборке можно было судить о генеральной совокупности, выборка

должна быть РЕПРЕЗЕНТАТИВНОЙ.
РЕПРЕЗЕНТАТИВНОЙ называется выборка,
верно отражающая основные законо-
мерности генеральной совокупности.
Условия репрезентативности:
случайный отбор
достаточно большой объем
Слайд 6

2. СПОСОБЫ ПРЕДСТАВЛЕНИЯ ВЫБОРКИ ПРОСТОЙ СТАТИСТИЧЕСКИЙ РЯД РАНЖИРОВАННЫЙ РЯД ВАРИАЦИОННЫЙ РЯД

2. СПОСОБЫ ПРЕДСТАВЛЕНИЯ ВЫБОРКИ

ПРОСТОЙ СТАТИСТИЧЕСКИЙ РЯД
РАНЖИРОВАННЫЙ РЯД
ВАРИАЦИОННЫЙ РЯД
ИНТЕРВАЛЬНЫЙ РЯД
ПРОСТОЙ СТАТИСТИЧЕСКИЙ

РЯД –
ПЕРЕЧИСЛЕНИЕ ЭЛЕМЕНТОВ ВЫБОРКИ
В ПОРЯДКЕ ИХ ПОЛУЧЕНИЯ.
Слайд 7

ПОСТРОЕНИЕ РАНЖИРОВАННОГО И ВАРИАЦИОННОГО РЯДОВ РАНЖИРОВАННЫЙ РЯД – ПЕРЕЧИСЛЕНИЕ ЭЛЕМЕНТОВ ВЫБОРКИ

ПОСТРОЕНИЕ РАНЖИРОВАННОГО И ВАРИАЦИОННОГО РЯДОВ

РАНЖИРОВАННЫЙ
РЯД –
ПЕРЕЧИСЛЕНИЕ ЭЛЕМЕНТОВ ВЫБОРКИ В ПОРЯДКЕ

ИХ ВОЗРАСТАНИЯ (ИЛИ УБЫВАНИЯ).
При этом каждое значение повторяется столько раз, сколько оно встречается в выборке.

Число появлений
данного значения, т.е. варианты, в выборке
называется частотой этой варианты, n.
Отношение частоты
к объему выборки
называется
относительной
частотой варианты,
W = n / N.

Слайд 8

ВАРИАЦИОННЫЙ РЯД ВАРИАЦИОННЫЙ РЯД – ПЕРЕЧИСЛЕНИЕ ВАРИАНТ В ПОРЯДКЕ ИХ ВОЗРАСТАНИЯ

ВАРИАЦИОННЫЙ РЯД

ВАРИАЦИОННЫЙ РЯД –
ПЕРЕЧИСЛЕНИЕ ВАРИАНТ
В ПОРЯДКЕ ИХ ВОЗРАСТАНИЯ
(ИЛИ

УБЫВАНИЯ)
С УКАЗАНИЕМ СООТВЕТСТВУЮЩИХ ЧАСТОТ
ИЛИ ОТНОСИТЕЛЬНЫХ ЧАСТОТ.


Таблица вариационного ряда
напоминает ряд распределения ДСВ.
Графическим изображением
вариационного ряда является полигон.

Слайд 9

ТАБЛИЦА ВАРИАЦИОННОГО РЯДА x1 n1 + n2 + ... + nk

ТАБЛИЦА ВАРИАЦИОННОГО РЯДА

x1 < x2 <... < xk

n1 + n2 +

... + nk = N

W1 + W2 + ... + Wk = 1,
проявление УСЛОВИЯ НОРМИРОВКИ
в статистике.

Слайд 10

ПОЛИГОН ЧАСТОТ или ОТНОСИТЕЛЬНЫХ ЧАСТОТ На оси абсцисс - значения xi

ПОЛИГОН ЧАСТОТ или ОТНОСИТЕЛЬНЫХ ЧАСТОТ
На оси абсцисс - значения xi ,
на

оси ординат - частоты ni или относительные частоты Wi.
Точки с координатами (xi, ni) соединяются отрезками прямых.
Полученная ломаная – полигон.
Слайд 11

ПОСТРОЕНИЕ ИНТЕРВАЛЬНОГО РЯДА ЕСЛИ ОБЪЕМ ВЫБОРКИ ВЕЛИК, ВАРИАЦИОННЫЙ РЯД ПРЕОБРАЗУЮТ В

ПОСТРОЕНИЕ ИНТЕРВАЛЬНОГО РЯДА

ЕСЛИ ОБЪЕМ ВЫБОРКИ ВЕЛИК,
ВАРИАЦИОННЫЙ РЯД ПРЕОБРАЗУЮТ
В ИНТЕРВАЛЬНЫЙ.
В

этом случае не пере-
числяют все варианты,
а разбивают вариацион-
ный ряд на несколько
интервалов и указывают
число значений
в каждом из них.
Слайд 12

Алгоритм построения интервального ряда Определение разумного числа интервалов: m = log2N,

Алгоритм построения интервального ряда

Определение
разумного числа интервалов:
m = log2N,
округляем до

целого числа.
2. Размах распределения:
L = xmax - xmin.

3. Шаг разбиения, или ширина интервала:
h = ∆x = L / m =
xmax - xmin
=
m

Слайд 13

4. Границы интервалов: получаются добавлением шага к предыдущей границе. Граница может

4. Границы интервалов:
получаются добавлением шага
к предыдущей границе.
Граница может входить

только в один интер-
вал, предыдущий или последующий.
[ - граница включа-ется в данный интервал;
( - граница не вклю-чается в интервал.

5. Подсчет частоты n - числа значений, попавших в данный интервал,
и относительной частоты
W = n / N.

Слайд 14

ГИСТОГРАММА Графическое изображение интервального ряда – ГИСТОГРАММА: фигура, состоящая из прямоугольников.

ГИСТОГРАММА

Графическое изображение
интервального ряда –
ГИСТОГРАММА:
фигура, состоящая из прямоугольников.
Основание каждого


прямоугольника - соответствующий интервал,
высота равна частоте или относительной частоте.
Пример.
У 12 больных гриппом,
прошедших предварительно
вакцинацию,
замерили температуру
в первые сутки болезни.
Получены значения – простой статистический ряд:
Слайд 15

37,5; 39,0; 38,1; 38,4; 37,9; 38,4; 38,4; 38,1; 38,6; 38,4; 38,6;

37,5; 39,0; 38,1; 38,4; 37,9; 38,4; 38,4; 38,1; 38,6; 38,4; 38,6;

38,4.
Ранжированный ряд:
37,5; 37,9; 38,1; 38,1; 38,4; 38,4; 38,4; 38,4; 38,4; 38,6; 38,6; 39,0.
Слайд 16

Вариационный ряд:

Вариационный ряд:

Слайд 17

ИНТЕРВАЛЬНЫЙ РЯД: m = log212 ≈ 3; L = 39,0 -

ИНТЕРВАЛЬНЫЙ РЯД:

m = log212 ≈ 3;
L = 39,0 - 37,5

= 1,5;
Δx = 1,5 / 3 = 0,5.
Определяем границы первого интервала:
левая граница – x min = 37,5,
правая граница - xmin + 0,5 = 38,0.
Левую границу включаем в первый интервал, правую – нет.
С нее начнется второй интервал.
Слайд 18

Таблица интервального ряда

Таблица интервального ряда

Слайд 19

3. ХАРАКТЕРИСТИКИ ВЫБОРКИ Средняя выборочная х Выборочная дисперсия Dв = σ2в

3. ХАРАКТЕРИСТИКИ ВЫБОРКИ

Средняя выборочная х
Выборочная дисперсия
Dв = σ2в
Выборочное средне-квадратическое отклонение

σв
Мода Мо
Медиана Ме

СРЕДНЯЯ
ВЫБОРОЧНАЯ
вариационного ряда:
Σ xi ni
x =
N
Если все ni =1, то
Σ xi
x =
N

Слайд 20

интервального ряда: Σ сk nk xи = N Здесь сk –

интервального ряда:
Σ сk nk
xи =
N
Здесь сk – середины

интервалов:
ck = (a + b) / 2 = a + Δx / 2
(a - левая граница интервала,
b - правая граница интервала).

Иными словами,
при вычислении харак-
теристик интервального
ряда его заменяют
(приближенно)
на вариационный вида:

Слайд 21

ВЫБОРОЧНАЯ ДИСПЕРСИЯ вариационного ряда: Σ (xi - x )2 ni σ2в

ВЫБОРОЧНАЯ ДИСПЕРСИЯ

вариационного ряда:
Σ (xi - x )2 ni
σ2в =


N
Если все ni = 1, то
Σ (xi - x )2
σ2в =
N

интервального ряда:
Σ (ck - xи)2 nk
σ2в =
N
ВЫБОРОЧНОЕ
СРЕДНЕКВАДРАТИЧНОЕ
ОТКЛОНЕНИЕ
σв = √ σ2в

Слайд 22

МОДА, МЕДИАНА МОДА – варианта с наибольшей частотой. МЕДИАНА делит вариационный

МОДА, МЕДИАНА

МОДА –
варианта с наибольшей частотой.
МЕДИАНА
делит вариационный ряд

пополам:
слева от нее столько же элементов,
сколько справа.

В случае четного числа элементов медиана
равна среднему
арифметическому
двух центральных.
Определяется легко по ранжированному ряду.
В нашем примере
Mo = Me = 38,4.

Слайд 23

4. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ПО ПАРАМЕТРАМ ВЫБОРКИ ПАРАМЕТРЫ ГЕНЕРАЛЬНОЙ

4. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ПО ПАРАМЕТРАМ ВЫБОРКИ

ПАРАМЕТРЫ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ


числовые
характеристики
исследуемой СВ:
математическое ожидание (средняя генеральная, средняя теоретическая) μ
дисперсия σ2
среднеквадратическое отклонение σ

ИХ ТОЧЕЧНЫЕ ОЦЕНКИ -
НАИБОЛЕЕ БЛИЗКИЕ
К НИМ (согласно теории)
ПАРАМЕТРЫ ВЫБОРКИ.
А именно:
точечная оценка
средней теоретической – средняя выборочная,
μ ≈ х

Слайд 24

Точечные оценки генеральной дисперсии – исправленная дисперсия, s2: σ2 ≈ s2

Точечные оценки

генеральной дисперсии – исправленная дисперсия, s2:
σ2 ≈ s2
среднеквадратичного отклонения –

стандартное отклонение, s:
σ ≈ s

Чтобы «исправить»
выборочную дисперсию,
нужно
ввести поправочный коэффициент:
N
s2 = σ2в∙
N-1

Слайд 25

Таким образом, Σ (xi - x )2 ni s2 = N

Таким образом,
Σ (xi - x )2 ni
s2 =

N – 1
Σ (ck - xи)2 nk
s2и =
N – 1
Далее s = √s2

Обратите внимание:
точечные оценки –
приблизительные
и
случайные
(так как выборка сделана
из генеральной совокуп-
ности случайным образом, то ее элементы и параметры
можно считать
случайными величинами)

Слайд 26

5. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ Дать ИНТЕРВАЛЬНУЮ ОЦЕНКУ того или

5. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

Дать ИНТЕРВАЛЬНУЮ ОЦЕНКУ
того или иного

пара-
метра генеральной совокупности –
значит указать
случайный интервал,
который с заданной

вероятностью γ
(гамма) содержит
данный параметр.
Этот интервал называется
ДОВЕРИТЕЛЬНЫМ,
а γ –
ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТЬЮ,
или НАДЕЖНОСТЬЮ.

Слайд 27

Наряду с доверительной вероятностью используют также понятие УРОВЕНЬ ЗНАЧИМОСТИ β =

Наряду с доверительной вероятностью
используют также понятие
УРОВЕНЬ ЗНАЧИМОСТИ
β = 1 –

γ,
т.е. вероятность того,
что доверительный интервал НЕ содержит в себе оцениваемый параметр.
Слайд 28

Доверительный интервал для средней теоретической нормально распределенной величины Имеет вид (

Доверительный интервал для средней теоретической нормально распределенной величины

Имеет вид
( х –

Δ , х + Δ).
Здесь Δ – абсолютная погрешность
интервальной оценки μ
по средней выборочной
х.
Но называть ее принято
ТОЧНОСТЬЮ оценки.

В данном случае надежность
γ = P(x – Δ < μ < х + Δ)
- вероятность того, что
доверительный интервал будет содержать в себе
среднюю теоретическую.

Слайд 29

Доверительную вероятность задаем сами, обычно в медицине это 95%, то есть

Доверительную вероятность задаем сами,
обычно в медицине это 95%,
то есть

γ = 0,95.
Точность Δ рассчитывается по формуле:

ts
Δ =
√ N
Среднюю выборочную и
стандартное отклонение
находим по выборке.

Слайд 30

t определяется по надежности с помощью известной формулы теории вероятности: γ

t определяется
по надежности с помощью известной формулы теории вероятности:
γ

= 2Ф (t) – 1.
Отсюда
2Ф (t) = 1+ γ,
1+ γ
Ф (t) =
2

Зная Ф (t),
по таблицам нормального распределения
находим t.
Так,
если γ = 0,95, то
Ф (t) = 0,975
и t ≈ 2.

Слайд 31

Если объем выборки невелик, то вместо таблицы нормального распределения нужно воспользоваться

Если объем выборки невелик, то вместо
таблицы нормального распределения нужно воспользоваться

таблицей
РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА.
Значение t в таблице этого распределения находят по заданным N и γ.

Запишем
АЛГОРИТМ
построения
доверительного
интервала
для средней
теоретической
нормально
распределенной
величины.

Слайд 32

Вычислить x и s. По заданной γ рассчитать Ф (t). По

Вычислить x и s.
По заданной γ рассчитать Ф (t).
По значению Ф

(t) в таблице найти значение t.
Рассчитать точность Δ оценки μ по х.

5. Записать ответ в виде:
х - Δ < μ < х + Δ.
Возможна краткая запись
μ = x ± Δ