Меры изменчивости

Содержание

Слайд 2

08/02/2023 Управление в социальных и экономических системах Вариабельность данных Меры центральной

08/02/2023

Управление в социальных и экономических системах

Вариабельность данных

Меры центральной тенденции говорят нам

о концентрации данных на числовой оси. Каждая такая мера в каком-то смысле наилучшим образом «представляет» данные.
Меры центральной тенденции игнорируют различия между данными.
Для измерения вариабельности данных требуются другие описательные статистики.
Слайд 3

08/02/2023 Управление в социальных и экономических системах Зачем нужны меры вариабельности

08/02/2023

Управление в социальных и экономических системах

Зачем нужны меры вариабельности данных?

Научная работа

связана с понятием вариабельности данных. Если есть много необъяснимых причин вариабельности, прогнозы будут неточными. Задача науки найти причины вариабельности данных и тем самым увеличить точность прогноза.
Например установлено, что наследственность и окружающая среда влияют на IQ ребенка. Поэтому информация о родителях ребенка и его воспитании позволяет более точно прогнозировать его умственное развитие в зрелости. Без такой информации прогноз будет менее точным.
Слайд 4

08/02/2023 Управление в социальных и экономических системах Наиболее часто используемые меры

08/02/2023

Управление в социальных и экономических системах

Наиболее часто используемые меры вариабельности данных

1.

Лимиты
2. Размах
3. Квантили
4. Дисперсия
5. Стандартная ошибка
6. Среднее отклонение
7. Коэффициент вариации
Слайд 5

08/02/2023 Управление в социальных и экономических системах Лимиты Это самая простая

08/02/2023

Управление в социальных и экономических системах

Лимиты

Это самая простая мера изменчивости.
Определяется

минимальное (Xmin) и максимальное значение (Xmax) массива данных. Между этими статистиками находятся все данные массива.
Несмотря на свою простоту эта мера используется редко, потому что экстремальные значения сильно подвержены ошибкам. Поэтому трудно определить влияние факторов на вариабельность данных.
Слайд 6

08/02/2023 Управление в социальных и экономических системах Размах Определяет расстояние на

08/02/2023

Управление в социальных и экономических системах

Размах

Определяет расстояние на числовой оси,

в пределах которого варьируются данные. R=Xmax-Xmin.
Исключающий размах – это разность максимального и минимального значений. Включающий размах – это разность между естественной верхней границей интервала, содержащего максимальное значение и естественной нижней границей интервала, содержащего минимальное значение.
Например рост 5 мальчиков равен 150, 155, 157, 165 и 168. Исключающий размах равен 168-150=18, включающий размах равен 168,5 – 149,5=19.
Слайд 7

08/02/2023 Управление в социальных и экономических системах Квантили Это характеристики вариационного

08/02/2023

Управление в социальных и экономических системах

Квантили

Это характеристики вариационного ряда, которые

отсекают определенную его часть. Наиболее часто используются квартили, децили и процентили.
Квартиль – это статистика, отсекающая ¼ часть ряда. Три квартиля Q1, Q2 и Q3 делят ряд на четыре, равные по объемы части (кварты).
Дециль (Di) – это статистика, отсекающая 1/10 часть ряда. Девять децилей делят ряд на 10 равных частей.
Процентиль (Pi) - это статистика, отсекающая 1/100 часть ряда. Девяносто девять процентилей делят ряд на 100 равных частей.
Слайд 8

08/02/2023 Управление в социальных и экономических системах Зачем нужны квантили? Квантили,

08/02/2023

Управление в социальных и экономических системах

Зачем нужны квантили?

Квантили, как и

медиана, - это важные характеристики вариационного ряда, особенно для асимметричных распределений. Часто квантили используются для установления границ тех или иных нормативов.
Размах от 90-ого до 10-ого процентиля является более стабильной мерой, чем размах.
Полу-междуквартильный размах Q3-Q1 содержит 50% наблюдений вариационного ряда.
Слайд 9

08/02/2023 Управление в социальных и экономических системах Дисперсия При вычислении всех

08/02/2023

Управление в социальных и экономических системах

Дисперсия

При вычислении всех предыдущих мер

вариабельности не учитывалось каждое отдельное значение массива данных.
Отклонения наблюдений от мер центральной тенденции несут информацию о вариабельности данных. Чем больше отклонения, тем больше вариабельность. Однако
Слайд 10

08/02/2023 Управление в социальных и экономических системах Формула для вычисления дисперсии

08/02/2023

Управление в социальных и экономических системах

Формула для вычисления дисперсии

Слайд 11

08/02/2023 Управление в социальных и экономических системах Свойства дисперсии 1. Прибавление

08/02/2023

Управление в социальных и экономических системах

Свойства дисперсии

1. Прибавление константы с к

каждому значению не влияет на дисперсию (а на среднее?)
2. Умножение каждого значения на константу с увеличивает дисперсию в с2 раз.
3. Дисперсия объединенной совокупности зависит как от дисперсий, так и от средних объединяемых групп
Слайд 12

08/02/2023 Управление в социальных и экономических системах Задача 3. Вычислить средние

08/02/2023

Управление в социальных и экономических системах

Задача 3. Вычислить средние и дисперсии

совокупностей:

А (3, 3, 3, 3) и В (7,7,7,7)

Слайд 13

08/02/2023 Управление в социальных и экономических системах Стандартное отклонение Эта мера

08/02/2023

Управление в социальных и экономических системах

Стандартное отклонение

Эта мера тесно связана с

дисперсией. Стандартное отклонение – это положительный корень из дисперсии.
Стандартное отклонение измеряется в тех же единицах, что и исходные данные. Например, как интерпретировать кг2 или л2?
Полезность этой меры еще и в том, что для многих распределений мы знаем, какая доля наблюдений находится внутри одного, двух, трех и более стандартных отклонений. Поэтому эта мера используется наиболее часто.
Слайд 14

08/02/2023 Управление в социальных и экономических системах Среднее отклонение Формула имеет

08/02/2023

Управление в социальных и экономических системах

Среднее отклонение

Формула имеет вид
Несмотря на

легкость вычисления и простоту интерпретации эта мера используется редко. Это объясняется тем, что эта мера неудобна для аналитический преобразований (например необходимо брать производную для поиска минимума функции).
Эта формула неудобна также для вычисления стандартизированных отклонений.
Слайд 15

08/02/2023 Управление в социальных и экономических системах Коэффициент вариации Формула для

08/02/2023

Управление в социальных и экономических системах

Коэффициент вариации

Формула для вычисления имеет вид
Эта

мера позволяет сравнивать вариабельность признаков имеющих разные единицы измерения.
Эта мера часто используется в биологии и других науках, где измеряемые признаки отличны от нуля.
Слайд 16

08/02/2023 Управление в социальных и экономических системах Стандартизированные данные Формула для

08/02/2023

Управление в социальных и экономических системах

Стандартизированные данные

Формула для вычисления имеет вид
Таким

образом любое множество данных на основе вычисленных среднего и стандартного отклонения можно преобразовать в стандартизированное множество с нулевым средним и единичной дисперсией. Это удобно для проверки различных статистических гипотез.
Слайд 17

08/02/2023 Управление в социальных и экономических системах Задача 4. Вычислить средние и дисперсии двух массивов

08/02/2023

Управление в социальных и экономических системах

Задача 4. Вычислить средние и дисперсии

двух массивов
Слайд 18

08/02/2023 Управление в социальных и экономических системах Задача. Вычислить дисперсию тестового балла

08/02/2023

Управление в социальных и экономических системах

Задача. Вычислить дисперсию тестового балла