Числові характеристики випадкових величин, показники варіації; первинна статистична обробка кількісних ознак

Содержание

Слайд 2

1. Генеральна сукупність та вибірка. Репрезентативність вибірки Генеральна сукупність (N) –

1. Генеральна сукупність та вибірка. Репрезентативність вибірки

Генеральна сукупність (N) – сукупність,

з якої обирають певну її частину для сумісного дослідження
Вибіркова сукупність (вибірка) (n)

Формування вибірки – повторна і безповторна вибірки
Репрезенативність вибірки – формування вибірки, коли вона найбільш повно представляє властивості генеральної сукупності
Метод досягнення – рандомізація – відбір об’єктів у вибірку з генеральної сукупності випадковим чином.

Слайд 3

2. Параметри генеральної сукупності і вибіркові характеристики Генеральна сукупність характеризується –

2. Параметри генеральної сукупності і вибіркові характеристики

Генеральна сукупність характеризується – генеральними

параметрами

Вибірка характеризується – вибірковими характеристиками, які наближаються до генеральних параметрів, але не дорівнюють їм
Точкові характеристики (міри положення, міри розсіювання, міри форми)
Інтервальні характеристики (довірчий інтервал для середнього)

Незміщені, ефективні

Статистичні похибки –
вказують на величину
відхилення вибіркової
характеристики від
відповідного генерального
параметра

Слайд 4

Класифікація даних дані Кількісні (числові) Якісні (категоріальні) дати дискретні неперервні Номінальні

Класифікація даних

дані

Кількісні
(числові)

Якісні
(категоріальні)

дати

дискретні

неперервні

Номінальні
(коди)

порядкові

Бінарні
(дихотомічні)

інтервальні

відносні

Слайд 5

Попереднє впорядкування даних Ранжування – розміщення всіх значень ознаки хі в

Попереднє впорядкування даних

Ранжування – розміщення всіх значень ознаки хі в порядку

зростання (спадання)
Ряд розподілу – ряд ранжованих даних, в якому розмах варіації (хmin – xmax) розбивають на рівні інтервали (класи) і шукають частоту зустрічаємості значень в кожному класі

Гістограма – графік розподілу частот

Значення ознаки (класові інтервали)

частота

Слайд 6

Побудова гістограм в програмі Statistica

Побудова гістограм в програмі Statistica

Слайд 7

Розбиття вибірок на класи Правило Старджеса: Число класів – k: k = 1 + 3.31*lg (n)

Розбиття вибірок на класи

Правило Старджеса:
Число класів – k:
k = 1 +

3.31*lg (n)
Слайд 8

Приклад: Дані по захворюваності на грип у районній поліклініці згрупували за

Приклад:

Дані по захворюваності на грип у районній поліклініці згрупували за віком.

Знайти міри положення цієї вибірки:
Слайд 9

Вибіркові характеристики:

Вибіркові характеристики:

Слайд 10

3. Міри положення Середнє арифметичне (mean) Xi - значення (точка) вибірки,

3. Міри положення Середнє арифметичне (mean)

Xi - значення (точка) вибірки,
n –

загальний об’єм вибірки
Хj – значення вибірки коли воно зустрічається декілька разів (серединне значення інтервалу),
nj – частота, з якою спостерігається значення хj (об’єм інтервалу)
k – кількість інтервалів
Слайд 11

Медіана (median) mx – середина вибірки (1/2 вибірки) h – ширина

Медіана (median)

mx – середина вибірки (1/2 вибірки)
h – ширина інтервалу,
mm –

об’єм медіанного інтервалу,
хМе – початок медіанного інтервалу,
mxmax – частота, накопичена на початок медіанного класу

- це значення, яке ділить ранжований варіаційний ряд на 2 рівні за об’ємом групи

Слайд 12

Мода (mode) xMo – початок модального інтервалу, h – ширина інтервалу,

Мода (mode)

xMo – початок модального інтервалу,
h – ширина інтервалу,
mMo – об’єм

модального інтервалу,
mMo-1 – об’єм інтервалу перед модальним
mMo+1 – об’єм інтервалу після модального

- це значення, яке спостерігається найбільшу кількість разів

Слайд 13

Міри розсіяння (варіації) - показують розкид даних у вибірці відносно середнього

Міри розсіяння (варіації) - показують розкид даних у вибірці відносно середнього значення

Варіаційний

розмах (розмах, range)
Емпірична дисперсія (вибіркова дисперсія) (variance)
Слайд 14

Стандартне відхилення (середнє квадратичне відхилення) (standard deviation) Інтерквартильний розмах (quartile range)

Стандартне відхилення (середнє квадратичне відхилення) (standard deviation)

Інтерквартильний розмах (quartile range)

0%

100%

25%

75%

50%

Xmin

Xmax

Q1

Q2

Q3

Me

Q1

– нижня квартиль (lower quartile)
Q3 – верхня квартиль (upper quartile)

Перцентіль – значення, яке міститься на межі певного % ранжованої вибірки

Слайд 15

Міри форми Асиметрія (skewness) – вказує, наскільки розподіл симетричний відносно середнього

Міри форми

Асиметрія (skewness) – вказує, наскільки розподіл симетричний відносно середнього (позитивна

і негативна асиметрія)
Ексцес (kurtosis) – міра гостроверхості відносно нормального розподілу (позитивний і негативний)