Описательная статистика

Содержание

Слайд 2

План лекции: Показатели центральной тенденции. Среднее арифметическое, его свойства. Мода, медиана.

План лекции:

Показатели центральной тенденции. Среднее арифметическое, его свойства.
Мода, медиана. Квартили. Соотношение

между показателями центральной тенденции.
Показатели изменчивости: размах, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Свойства дисперсии.
Показатели ассиметрии и эксцесса.
Слайд 3

Показатели центральной тенденции. Среднее арифметическое, его свойства.

Показатели центральной тенденции.
Среднее арифметическое, его свойства.

Слайд 4

Средняя арифметическая ( х ) – одна из основных характеристик вариационного

Средняя арифметическая ( х ) – одна из основных характеристик вариационного

ряда, являющаяся центром распределения, вокруг которого группируются все варианты статистической совокупности.
Слайд 5

Для негруппированных данных эта величина определяется как сумма всех членов совокупности

Для негруппированных данных эта величина определяется как сумма всех членов совокупности

деленная на их общее число n.

где:
- значения вариант
- знак суммирования вариант в пределах от первой до n- й варианты
- общее число вариант

Слайд 6

Для данных, группируемых с учетом повторяемости или веса (pi) отдельных вариант

Для данных, группируемых с учетом повторяемости или веса (pi) отдельных вариант

средняя арифметическая, называемая взвешенной определяется по формуле:
Слайд 7

Свойства среднего арифметического: 1. Если каждую варианту совокупности уменьшить или увеличить

Свойства среднего арифметического:

1. Если каждую варианту совокупности уменьшить или увеличить на

какое-то произвольное положительное число А, то и средняя уменьшиться увеличиться на столько же.
Слайд 8

2. Если каждую варианту совокупности разделить или умножить на одно и

2. Если каждую варианту совокупности разделить или умножить на одно и

то же число А, то и средняя арифметическая изменится во столько же раз.
Слайд 9

3. Сумма произведений отклонений вариант от их средней арифметической на соответствующие им частоты равна нулю.

3. Сумма произведений отклонений вариант от их средней арифметической на соответствующие

им частоты равна нулю.
Слайд 10

4. Сумма квадратов отклонений вариант от их средней арифметической меньше суммы

4. Сумма квадратов отклонений вариант от их средней арифметической меньше суммы

квадратов отклонений тех же вариант от любой другой величины А не равной х:
Слайд 11

Мода, медиана. Квартили. Соотношение между показателями центральной тенденции.

Мода, медиана. Квартили. Соотношение между показателями центральной тенденции.

Слайд 12

Медиана эмпирического распределения (Me) (от лат. Mediana – средняя) – средняя,

Медиана эмпирического распределения (Me) (от лат. Mediana – средняя) – средняя,

относительно которой ряд распределения делится на две половины: в обе стороны от медианы располагается одинаковое число членов ряда (вариант).
Если число членов ранжированного ряда нечетное, то центральная варианта и будет Me.
При четном числе членов ряда медиана определяется по полусумме двух соседних вариант, расположенных в центре ряда.
Слайд 13

Если выборка распределена в вариационный ряд, медиана определяется как: нижняя граница

Если выборка распределена в вариационный ряд, медиана определяется как:
нижняя граница

интервала, в котором находится медиана или полусумма соседних классов;
частота медианного класса;
число накопленных частот, стоящих перед медианным классом;
i величина классового интервала;
n общее число наблюдений.
Слайд 14

Мода (Mo) – величина, которая встречается в данной совокупности наиболее часто.

Мода (Mo) – величина, которая встречается в данной совокупности наиболее часто.


Класс с наибольшей частотой называется модальным.
где:
- нижняя граница модального класса, т.е. класса с
наибольшей частотой ( )
- частота класса, предшествующего модальному,
- частота класса, следующего за модальным,
- ширина классового промежутка.

Слайд 15

Квантили - структурные средние характеристики вариационного ряда, отсекающие в пределах вариационного

Квантили - структурные средние характеристики вариационного ряда, отсекающие в пределах вариационного

ряда определенную часть его членов, вариант.

КВАНТИЛИ:

Слайд 16

Квартиль – величина, отсекающая 1/4 членов ряда. (3 квартиля делят весь

Квартиль – величина, отсекающая 1/4 членов ряда.
(3 квартиля делят весь вариационный

ряд на четыре равночисленные части (кварты)).
Дециль – величина, отделяющая 1/10 часть всех членов вариационного ряда.
(9 децилей делят весь вариационный ряд на десять равных частей).
Перцентиль (процентиль) отсекает сотые доли вариант.
(99 децилей делят совокупность на 100 равных частей).
Слайд 17

Показатели изменчивости

Показатели изменчивости

Слайд 18

Лимиты (от лат limes - предел) – значения максимальной и минимальной

Лимиты (от лат limes - предел) – значения максимальной и минимальной

вариант, между которыми распределяются все члены данной совокупности.
Слайд 19

Размах вариации – показатель, характеризующий варьирование признаков.

Размах вариации – показатель, характеризующий варьирование признаков.

Слайд 20

Дисперсия (от лат. Dispersion - рассеяние) или варианса (англ. Variance -

Дисперсия (от лат. Dispersion - рассеяние) или варианса (англ. Variance -

изменение, вариация) – важнейшая характеристика вариационного ряда.
Дисперсия генеральной совокупности - σ², дисперсия выборки - S² .
Слайд 21

Знак суммирования произведений отклонений вариант xi от их средней Частоты Объем

Знак суммирования произведений отклонений вариант xi от их средней

Частоты

Объем

выборки

Число степеней свободы

Число степеней свободы - число свободно варьирующих единиц или элементов в составе данной ограниченной совокупности.

Слайд 22

Свойства дисперсии: 1. Если каждую варианту совокупности увеличить или уменьшить на

Свойства дисперсии:

1. Если каждую варианту совокупности увеличить или уменьшить на одно

и то же постоянное число А, то дисперсия не изменится.
Т.о. дисперсию можно вычислить не только по значениям признака, но и по их отклонениям от какой-нибудь постоянной величины А.
Слайд 23

2. Если каждую варианту разделить или умножить на одно и то

2. Если каждую варианту разделить или умножить на одно и то

же постоянное число А, то дисперсия уменьшится или увеличится в А2 раз.
Слайд 24

Среднее квадратическое отклонение (Sx) Характеризует величину и специфику варьирования признака. Среднее

Среднее квадратическое отклонение (Sx)
Характеризует величину и специфику варьирования признака.
Среднее квадратическое отклонение

=
Cтандартное отклонение (standard deviation – англ.)
Чем сильнее варьирует признак, тем больше среднее квадратическое отклонение.
Дисперсия и среднее квадратическое отклонение выражаются в тех же единицах, что и характеризуемый признак.
Слайд 25

Показатель, предложенный К. Пирсеном –обозначаемый буквой V (или CV) называется коэффициентом вариации.

Показатель, предложенный К. Пирсеном –обозначаемый буквой V (или CV) называется коэффициентом

вариации.
Слайд 26

В качестве констант, характеризующих случайную величину, можно использовать математические ожидания целых

В качестве констант, характеризующих случайную величину, можно использовать математические ожидания целых

степеней случайной величины.

Начальные моменты k-й степени

Слайд 27

Проверка нормальности распределения с помощью показателей асимметрии и эксцесса Выборочные характеристики

Проверка нормальности распределения с помощью показателей асимметрии и эксцесса

Выборочные характеристики

— средняя величина и показатели вариации — не содержат информации о законе распределения генеральной совокупности, из которой выборка взята. Трудно судить о законе распределения и по эмпирической вариационной кривой, поскольку на ней сказывается влияние многочисленных случайных причин. Между тем знание закона распределения важно: оно гарантирует от возможных ошибок в оценке генеральных параметров на основании выборочных показателей.
Многие биологические признаки распределяются нормально. Нередко, однако, эмпирические ряды распределения отклоняются более или менее заметно от нормальной кривой. Эти отклонения могут быть различными, обнаруживая в одних случаях асимметрию, в других — эксцесс, а иногда и то и другое одновременно.
Слайд 28

Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном, 1895) является

Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном, 1895) является

мерой несимметричности распределения.


Где:
μ3  -   равно   ∑(xi- среднееx)3
σ3  -  стандартное отклонение (сигма), возведенное в
третью степень;
n   - число наблюдений.

Слайд 29

Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном, 1895) является

Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном, 1895) является

мерой несимметричности распределения.


Где:
μ3  -   равно   ∑(xi- среднееx)3
σ3  -  стандартное отклонение (сигма), возведенное в
третью степень;
n   - число наблюдений.

Слайд 30

Слайд 31

Асимметрия ряда выражается графически в виде скошенной вариационной кривой, вершина которой

Асимметрия ряда выражается графически в виде скошенной вариационной кривой, вершина которой

может быть сдвинута от центра распределения либо влево, либо вправо.

Плотность нормального распределения симметрична относительно среднего.

Слайд 32

Коэффициент ассиметрии – величина безразмерная, может принимать значения от -∞ до

Коэффициент ассиметрии – величина безразмерная, может принимать значения от -∞ до

+∞.
При симметричном распределении μ(3)=0 и α=0.
Слайд 33

Асимметрию называют правосторонней или положительной, если вершина кривой сдвинута влево от

Асимметрию называют правосторонней или положительной, если вершина кривой сдвинута влево от

центра распределения; она более пологая, сильно растянутая по оси абсцисс.
При левосторонней, или отрицательной, асимметрии, наоборот, вершина кривой сдвинута вправо от центра распределения, а ее пологая часть находится на левой стороне.
Слайд 34

Эксцесс Термин был впервые введен Пирсоном, 1905. Коэффициент эксцесса измеряет "пикообразность"

Эксцесс

Термин был впервые введен Пирсоном, 1905.
Коэффициент эксцесса измеряет "пикообразность" распределения.


Оценка эксцесса (выборочный эксцесс) вычисляется по формуле:  
Где
Mj    равен (xi-Meanx)j
 n      - число наблюдений
- стандартное отклонение (сигма), возведенное в четвертую степень.
Слайд 35

Эксцесс Термин был впервые введен Пирсоном, 1905. Коэффициент эксцесса измеряет "пикообразность"

Эксцесс

Термин был впервые введен Пирсоном, 1905.
Коэффициент эксцесса измеряет "пикообразность" распределения.


Если эксцесс значимо отличен от 0, то функция плотности либо имеет более закругленный, либо более острый пик, чем пик плотности нормального распределения.
Функция плотности нормального распределения имеет эксцесс равный 0.
Оценка эксцесса (выборочный эксцесс) вычисляется по формуле:  
Где
Mj    равен (xi-Meanx)j
 n      - число наблюдений
- стандартное отклонение (сигма), возведенное в четвертую степень.
Слайд 36



Слайд 37

Если эксцесс значимо отличен от 0, то функция плотности либо имеет

Если эксцесс значимо отличен от 0, то функция плотности либо имеет

более закругленный, либо более острый пик, чем пик плотности нормального распределения.
Функция плотности нормального распределения имеет эксцесс равный 0.
Слайд 38