Графики и описательная статистика

Содержание

Слайд 2

Методы исследования

Методы исследования

Слайд 3

Методы исследования

Методы исследования

Слайд 4

Описательная статистика Методы и способы, используемые для «суммирования», организации и «уменьшения» большого количества наблюдений (статистических опытов).

Описательная статистика

Методы и способы, используемые для «суммирования», организации и «уменьшения»

большого количества наблюдений (статистических опытов).
Слайд 5

Описательная статистика Частотные распределения и графики Меры центральной тенденции Меры изменчивости Меры положения Меры формы …

Описательная статистика

Частотные распределения и графики
Меры центральной тенденции
Меры изменчивости
Меры положения
Меры формы

Слайд 6

Группировка данных Предположим, мы спрашивали студентов, насколько их провал на экзамене

Группировка данных

Предположим, мы спрашивали студентов, насколько их провал на экзамене зависел

от причин, которые они никак не могли контролировать.
Ответы даются по шкале от 1 до 7
(1 - совсем не зависел, 7 - полностью зависел)
Гипотетические данные опроса 25 студентов:
 3,5,6,5,2,3,6,4,6,7,6,4,5,5,1,2,5,4,4,5,5,7,3,3,4
Слайд 7

Группировка данных Гипотетические данные опроса 25 студентов: 3,5,6,5,2,3,6,4,6,7,6,4,5,5,1,2,5,4,4,5,5,7,3,3,4 1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7

Группировка данных

Гипотетические данные опроса 25 студентов:
 3,5,6,5,2,3,6,4,6,7,6,4,5,5,1,2,5,4,4,5,5,7,3,3,4

1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7

Слайд 8

Группировка данных 1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7

Группировка данных

1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7

Слайд 9

Группировка данных

Группировка данных

Слайд 10

Группировка данных Столбчатая диаграмма

Группировка данных

Столбчатая диаграмма

Слайд 11

Группировка данных Гистограмма

Группировка данных

Гистограмма

Слайд 12

Группировка данных ПОЛИГОН

Группировка данных

ПОЛИГОН

Слайд 13

Группировка данных КУМУЛЯТА

Группировка данных

КУМУЛЯТА

Слайд 14

Группировка данных А если значений много? 40, 48, 11, 16, 52,

Группировка данных

А если значений много?
40, 48, 11, 16, 52, 64, 21,

33, 39, 69, 45, 8,35, 22, 57, 74, 13, 25, 47, 27, 38, 43, 15, 33, 66, 52, 47, 37, 0, 24, 43, 61, 35, 29, 52, 40, ….
Слайд 15

Группировка данных Частотная таблица получается большой:

Группировка данных

Частотная таблица получается большой:

Слайд 16

Группировка данных Тогда стоит сгруппировать значения переменной в интервалы 1. Найти

Группировка данных

Тогда стоит сгруппировать значения переменной в интервалы

1. Найти разницу между

наибольшим и наименьшим значением
и прибавить к ней 1
(74-0)+1=75

2. Разделить ответ на число выбранных интервалов и округлить до ближайшего нечетного числа
i=75/10=7.5 ≈ 7

3. К самому маленькому значению переменной прибавить i-1
0+i-1=0+7-1=6
Первый интервал будет от 0 до 6

4. Следующий интервал начинается с числа, которое следует за наибольшим значением предыдущего интервала
7+i-1=7+7-1=13
Второй интервал будет от 7 до 13

Слайд 17

Группировка данных

Группировка данных

Слайд 18

Использование графиков

Использование графиков

Слайд 19

Использование графиков

Использование графиков

Слайд 20

Использование графиков

Использование графиков

Слайд 21

Использование графиков Lie factor – отношение разницы в размере элементов графика

Использование графиков

Lie factor – отношение разницы в размере элементов графика к

разнице величин, которые они представляют
Наиболее информативные («честные») графики имеют Lie factor =1
Слайд 22

Использование графиков 14,8

Использование графиков

14,8

Слайд 23

Использование графиков Следует избегать соединения изменений в оформлении графика с изменениями в данных

Использование графиков

Следует избегать соединения изменений в оформлении графика с изменениями в

данных
Слайд 24

Использование графиков

Использование графиков

Слайд 25

Использование графиков Еще одна проблема – многомерные изменения, т.е. изменения сразу

Использование графиков

Еще одна проблема – многомерные изменения, т.е. изменения сразу по

нескольким размерностям, например, по высоте и ширине.
Если масштабирование ведется сразу по двум измерениям, площадь изменяется пропорционально квадрату изменений!
Слайд 26

Использование графиков 2,8

Использование графиков

2,8

Слайд 27

Использование графиков

Использование графиков

Слайд 28

Использование графиков

Использование графиков

Слайд 29

Основные понятия Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных

Основные понятия

Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.
Генеральной

совокупностью называют совокупность объектов, из которых производится выборка.
Слайд 30

Основные понятия Параметры – это меры описания, полученные при сплошном описании

Основные понятия

Параметры – это меры описания, полученные при сплошном описании (описании

генеральной совокупности).
Статистики (или оценки параметров) – это те же меры, но полученные при выборочном наблюдении (т.е. параметры описывают генеральную совокупность, а статистики – ее выборку).
Слайд 31

Генеральная и выборочная совокупности Генеральная совокупность Выборка Параметр Статистика

Генеральная и выборочная совокупности

Генеральная совокупность
Выборка

Параметр
Статистика

Слайд 32

Выборки Выборки бывают разные! Классификация Л.Мюллера и К. Шусслера По критерию

Выборки

Выборки бывают разные!
Классификация Л.Мюллера и К. Шусслера
По критерию методов отбора выборки

бывают
1) Не случайные
2) Случайные (вероятностные, пробабилистские)
Слайд 33

Выборки Классификация Л.Мюллера и К. Шусслера 1) Не случайные – не

Выборки

Классификация Л.Мюллера и К. Шусслера
1) Не случайные – не имеют теоретико-вероятностного

обоснования и, следовательно, не соответствуют критерию репрезентативности, т.е. статистики не могут выступать оценками генеральной совокупности
Слайд 34

Выборки Классификация Л.Мюллера и К. Шусслера 1) Не случайные 1.1) Бессистемная

Выборки

Классификация Л.Мюллера и К. Шусслера
1) Не случайные
1.1) Бессистемная выборка
1.2) Доступная выборка
1.3)

Целенаправленная выборка
Слайд 35

Выборки Классификация Л.Мюллера и К. Шусслера 1.1) Бессистемная выборка Отбор любых

Выборки

Классификация Л.Мюллера и К. Шусслера
1.1) Бессистемная выборка
Отбор любых случайно встретившихся

прохожих, согласившихся принять участие в исследовании.
Может использоваться только для самого первого ознакомления с проблемной ситуацией
Слайд 36

Выборки Классификация Л.Мюллера и К. Шусслера 1.2) Доступная выборка Формируется из

Выборки

Классификация Л.Мюллера и К. Шусслера
1.2) Доступная выборка
Формируется из числа лиц,

которые по субъективным и объективным факторам могут быть включены в число респондентов, т.е. доступны физически.
Используется для накопления данных о латентных или аномальных явлениях
Слайд 37

Выборки Классификация Л.Мюллера и К. Шусслера 1.3) Целенаправленная выборка Преднамеренный отбор

Выборки

Классификация Л.Мюллера и К. Шусслера
1.3) Целенаправленная выборка
Преднамеренный отбор определенной категории

респондентов, которые по оценке исследователя в наибольшей степени информированы по проблеме или заинтересованы в ее изучении
Используется в экспертных опросах, лабораторных исследованиях и социальных экспериментах
Слайд 38

Выборки Классификация Л.Мюллера и К. Шусслера 2) Случайные 2.1) Простая случайная

Выборки

Классификация Л.Мюллера и К. Шусслера
2) Случайные
2.1) Простая случайная
2.2) Серийная
2.3) Систематическая (интервальная)
2.4)

Стратифицированная
2.5) Комбинированная
Слайд 39

Выборки Классификация Л.Мюллера и К. Шусслера 2.1) Простая случайная – формируется

Выборки

Классификация Л.Мюллера и К. Шусслера
2.1) Простая случайная – формируется путем случайного

отбора единиц наблюдения из однородной генеральной совокупности (жребий, таблицы случайных чисел, компьютерное моделирование)
.
Слайд 40

Выборки Классификация Л.Мюллера и К. Шусслера 2.2) Серийная – единицами отбора

Выборки

Классификация Л.Мюллера и К. Шусслера
2.2) Серийная – единицами отбора являются статистические

серии (таксоны, гнезда) – территориальные общности, коллективы, семьи и т.д. Серии выбираются по методике простой случайной выборки
Слайд 41

Выборки Классификация Л.Мюллера и К. Шусслера 2.3) Систематическая (интервальная) – отбор

Выборки

Классификация Л.Мюллера и К. Шусслера
2.3) Систематическая (интервальная) – отбор единиц производится

через один и тот же интервал, при этом начало отсчета определяется случайным образом
Слайд 42

Выборки Классификация Л.Мюллера и К. Шусслера 2.4) Стратифицированная выборка на основе

Выборки

Классификация Л.Мюллера и К. Шусслера
2.4) Стратифицированная выборка на основе предварительного выделения

в генеральной совокупности однородных частей, типических групп (страт). В каждой страте производится случайный отбор единиц наблюдения, как правило, пропорционально их доле в генеральной совокупности.
Слайд 43

Выборки Классификация Л.Мюллера и К. Шусслера 2.5) Комбинированная – выборка, в

Выборки

Классификация Л.Мюллера и К. Шусслера
2.5) Комбинированная – выборка, в которой используются

различные способы отбора.
Например: Гнездовая выборка – по два предприятия из типичных групп (сильных, средних и слабых). Далее отбор респондентов осуществляется интервальным методом.
Слайд 44

И это все?

И это все?

Слайд 45

Меры центральной тенденции Среднее арифметическое (М или х) Медиана Me или

Меры центральной тенденции

Среднее арифметическое (М или х)
Медиана Me или

срединное значение
Мода Md (наиболее вероятное значение)
Слайд 46

Меры центральной тенденции Среднее арифметическое M=(x1+…+xN)/N 1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7 М=(1+2+2+3+3+….+6+7+7)/25=4,4

Меры центральной тенденции

Среднее арифметическое
M=(x1+…+xN)/N

1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7

М=(1+2+2+3+3+….+6+7+7)/25=4,4

Слайд 47

Меры центральной тенденции Медиана Me 1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7 прибавляем 1 к числу значений

Меры центральной тенденции

Медиана Me

1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7

прибавляем 1 к числу значений (размеру выборки)

и делим на 2. Затем определяет значение, которое соответствует вычисленной позиции в последовательности значений.
(25+1)/2=13
Me=5
Слайд 48

Меры центральной тенденции 1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7 А что же делать, когда у нас

Меры центральной тенденции

1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7

А что же делать, когда у нас четное число

значений? В этом случае медиана - это значение, которое приходится как раз посередине двух срединных значений. (24+1)/2=12,5
значит, значение медианы будет между 12-й и 13-й позицией
Me=(4+5)/2=4,5
Слайд 49

Меры центральной тенденции Мода Мd=5 1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7

Меры центральной тенденции

Мода
Мd=5

1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7,7

Слайд 50

Доверительный интервал Доверительный интервал (95% confidence limits of mean) для среднего

Доверительный интервал

Доверительный интервал
(95% confidence limits of mean)
для среднего представляет интервал

значений вокруг оценки, где с данным уровнем доверия находится «истинное» (неизвестное) среднее генеральной совокупности.
Слайд 51

Доверительный интервал Если среднее выборки равно 23, а нижняя и верхняя

Доверительный интервал

Если среднее выборки равно 23, а нижняя и верхняя границы

доверительного интервала с уровнем p=.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее генеральной совокупности.
Слайд 52

Стой, Подумай, Примени Найдите среднее, моду и медиану для следующих данных

Стой, Подумай, Примени

Найдите среднее, моду и медиану для следующих данных
10,

8, 6, 0, 8, 3, 2, 5, 8, 0

среднее=5, медиана=5,5, мода=8

Слайд 53

Стой, Подумай, Примени Среди мужчин, приговоренных к пожизненному заключению, только 10

Стой, Подумай, Примени

Среди мужчин, приговоренных к пожизненному заключению, только 10

% подвергаются повторному наказанию.
Среди тех, кого осудили на срок до 6 месяцев, повторно судимых (и опять приговоренных) 60 %. Следовательно, более длительное тюремное заключение более эффективно
Слайд 54

Стой, Подумай, Примени Смертность американских солдат во время войны в Персидском

Стой, Подумай, Примени

Смертность американских солдат во время войны в Персидском

заливе была 9 человек на 1000. В это же время смертность гражданских лиц, например в Нью-Йорке была 16 человек на 1000. Следовательно, во время войны действующая армия − самое безопасное место.
Слайд 55

Стой, Подумай, Примени Знаете ли вы что…. Большинство людей из Великобритании

Стой, Подумай, Примени

Знаете ли вы что….
Большинство людей из Великобритании имеют

больше ног, чем человек в среднем?

Это поистине очевидно. Среди 57 млн. жителей Великобритании около 5 000 имеют одну ногу. Следовательно, среднее количество ног будет
((5000*1)+(56995000*2))/ 57000000= 1.999123
Так как большинство имеют две ноги…

Слайд 56

Меры изменчивости Размах Дисперсия Стандартное (среднеквадратичное) отклонение Стандартная ошибка

Меры изменчивости

Размах
Дисперсия
Стандартное (среднеквадратичное) отклонение
Стандартная ошибка

Слайд 57

Меры изменчивости Средний вес команды = 95 кг

Меры изменчивости

Средний вес команды = 95 кг

Слайд 58

Меры изменчивости Средний вес команды тоже = 95 кг

Меры изменчивости

Средний вес команды тоже = 95 кг

Слайд 59

Меры изменчивости Размах R = Xmax- Xmin 1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7 R = Xmax– Xmin=7-1=6

Меры изменчивости

Размах R = Xmax- Xmin

1,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,7
R = Xmax– Xmin=7-1=6

Слайд 60

Меры изменчивости Дисперсия

Меры изменчивости

Дисперсия

Слайд 61

Меры изменчивости Пример. Вычислить дисперсию для следующей выборки: 5, 6, 3,

Меры изменчивости

Пример. Вычислить дисперсию для следующей выборки:
5, 6, 3, 8, 5,

9

Вычисляем среднее арифметическое: = (5+6+3+8+5+9)/6=6

Слайд 62

Меры изменчивости Подставляем в формулу:

Меры изменчивости

Подставляем в формулу:

Слайд 63

Меры изменчивости Другая формула для дисперсии:

Меры изменчивости
Другая формула для дисперсии:

Слайд 64

Меры изменчивости Стандартное отклонение

Меры изменчивости
Стандартное отклонение

Слайд 65

Меры изменчивости Стандартная ошибка среднего значения - это стандартное отклонение, деленное

Меры изменчивости

Стандартная ошибка среднего значения - это стандартное отклонение, деленное на

квадратный корень из объема выборки.
Слайд 66

Меры изменчивости Стандартная ошибка среднего значения - это стандартное отклонение, деленное

Меры изменчивости

Стандартная ошибка среднего значения - это стандартное отклонение, деленное на

квадратный корень из объема выборки.

Гляньте-ка! СЕКС!
И прямо тут, в формуле!

Слайд 67

Меры изменчивости В диапазоне удвоенной стандартной ошибки по обе стороны от

Меры изменчивости

В диапазоне удвоенной стандартной ошибки по обе стороны от среднего

значения с вероятностью примерно 95% находится среднее значение генеральной совокупности.
Слайд 68

Стой, Подумай, Примени Найдите размах и дисперсию для следующих данных 10,

Стой, Подумай, Примени

Найдите размах и дисперсию для следующих данных
10, 8,

6, 0, 8, 3, 2, 5, 8, 0

размах=10, дисперсия=12,8889

Слайд 69

Меры положения Квантили - структурные характеристики вариационного ряда, отсекающие в пределах

Меры положения

Квантили - структурные характеристики вариационного ряда, отсекающие в пределах ряда

определенную часть его членов.
К ним относятся квартили, децили и перцентили (центили).
Слайд 70

Меры положения Квантиль – это точка на числовой оси, на которой

Меры положения

Квантиль – это точка на числовой оси, на которой откладываются

результаты наблюдений. Эта точка делит всю совокупность наблюдений на части (группы) с определенными пропорциями между ними.
Слайд 71

Процентили Перцентили (центили, процентили) отделяют от совокупности по 0,01 части (делят

Процентили

Перцентили (центили, процентили) отделяют от совокупности по 0,01 части (делят совокупность

на 100 равных частей), их 99.
Слайд 72

Процентили В 1985 году примерно 24,7 миллионов людей в Соединенных Штатах

Процентили

В 1985 году примерно 24,7 миллионов людей в Соединенных Штатах были

в возрасте 65 лет и старше
Таня набрала 41 балл по тесту по математике в этом году
Слайд 73

Процентили В 1985 году примерно 24,7 миллионов людей в Соединенных Штатах

Процентили

В 1985 году примерно 24,7 миллионов людей в Соединенных Штатах были

в возрасте 65 лет и старше
89% населения США находится в возрасте не старше 65 лет
89 – это и есть процентиль для 65-летних
Слайд 74

Процентили Процентиль какого-либо значения, таким образом, представляет собой процент случаев, которые

Процентили

Процентиль какого-либо значения, таким образом, представляет собой процент случаев, которые имеют

то же самое или меньшее значение
Сказать «возрасту 65 лет соответствует 89 процентиль» - это сказать, что
«89% населения США находится в возрасте 65 лет и меньше»
Слайд 75

Процентили Таня набрала 41 балл по тесту по математике в этом

Процентили

Таня набрала 41 балл по тесту по математике в этом году,

и это соответствует 62 процентилю.
62% белорусских абитуриентов сдали так же, как Таня или еще хуже,
и только 38% были лучше ее.
Слайд 76

Процентили Можно определить прямо по графику накопленных процентов

Процентили

Можно определить прямо по графику накопленных процентов

Слайд 77

Процентили Какой процентиль соответствует ответу 4? Какой процент студентов считает, что

Процентили

Какой процентиль соответствует ответу 4?
Какой процент студентов считает, что результат провала

на экзамене скорее зависел от них, чем от причин, которые они не могли контролировать?
Слайд 78

Процентили Какой процентиль соответствует ответу 4?

Процентили

Какой процентиль соответствует ответу 4?

Слайд 79

Процентили Можно определить по формуле Процентиль=(накопленная частота/N)*100

Процентили

Можно определить по формуле
Процентиль=(накопленная частота/N)*100

Слайд 80

Процентили Seiden, R.H. (1966) “Campus Tragedy: A Story of Students Suicide”

Процентили

Seiden, R.H. (1966) “Campus Tragedy: A Story of Students Suicide” Journal

of Abnormal Psychology, 71, 389-399

Правда ли, что сессионная пара – необычайно стрессовая ситуация для студента, которая приводит даже к самоубийствам?

Слайд 81

Процентили

Процентили

Слайд 82

Процентили Процентиль всегда выражает положение значения по отношению к какой-либо выборке:

Процентили

Процентиль всегда выражает положение значения по отношению к какой-либо выборке:
Таня

набрала такое количество баллов по тесту по математике, которое соответствует 93 процентилю.
Она сдавала математику с 8-классниками обычной школы
Она сдавала математику с 11-классниками математической школы
Слайд 83

Меры положения Квартили - значения, которые делят две половины выборки (разбитые

Меры положения

Квартили - значения, которые делят две половины выборки (разбитые медианой)

еще раз пополам.
Таким образом, медиана и квартили делят диапазон значений переменной на четыре равные части.
Слайд 84

Меры положения Верхний квартиль (Q3) делит пополам верхнюю часть выборки (значения

Меры положения

Верхний квартиль (Q3) делит пополам верхнюю часть выборки (значения переменной

больше медианы).
Нижний квартиль (Q1) делит пополам нижнюю часть выборки (значения переменной меньше медианы).
Внутриквартильный (квартильный) размах = Q3-Q1
Слайд 85

Меры положения Нижний квартиль часто обозначают символом 25%, это означает, что

Меры положения

Нижний квартиль часто обозначают символом 25%, это означает, что 25%

значений переменной меньше нижнего квартиля.
Верхний квартиль часто обозначают символом 75%, это означает, что 75% значений переменной меньше верхнего квартиля.
Слайд 86

Меры положения Квинтили делят значения наблюдений на 5 частей, их 4

Меры положения

Квинтили делят значения наблюдений на 5 частей, их 4 (К1,

К2, К3, К4).
Децили делят совокупность на 10 частей, их 9 (D1, …, D9).
Слайд 87

Меры положения

Меры положения

Слайд 88

Меры положения

Меры положения

Слайд 89

Меры формы Асимметрия является мерой несимметричности распределения. Если этот коэффициент значительно

Меры формы

Асимметрия является мерой несимметричности распределения. Если этот коэффициент значительно отличается

от 0, распределение является асимметричным

А=

Слайд 90

Меры формы Симметричное распределение (А=0) Когда распределение симметрично, среднее, мода и медиана совпадают Х=Ме=Md

Меры формы

Симметричное распределение (А=0)
Когда распределение симметрично, среднее, мода и медиана совпадают


Х=Ме=Md

Слайд 91

Меры формы Левостороннее, положительное распределение Если среднее больше медианы, то распределение

Меры формы

Левостороннее, положительное распределение
Если среднее больше медианы, то распределение называется

левосторонним или положительно асимметричным (по знаку числовой характеристики А>0).

Md Ме Х

Слайд 92

Меры формы Отрицательное, правостороннее распределение Если среднее меньше медианы, то распределение

Меры формы

Отрицательное, правостороннее распределение
Если среднее меньше медианы, то распределение

называется правосторонним или отрицательно асимметричным (A<0).

Х Ме Md

Слайд 93

Меры формы Эксцесс измеряет остроту пика распределения Е=

Меры формы

Эксцесс измеряет остроту пика распределения

Е=

Слайд 94

Меры формы Положительный эксцесс

Меры формы

Положительный эксцесс

Слайд 95

Меры формы Отрицательный эксцесс

Меры формы

Отрицательный эксцесс

Слайд 96

Нормальное распределение Нормальное распределение: f(x)=(1/σ√2π)exp{(x-m)2/2σ2} cреднее значение m дисперсия σ2 асимметрия

Нормальное распределение

Нормальное распределение: f(x)=(1/σ√2π)exp{(x-m)2/2σ2}
cреднее значение m
дисперсия σ2
асимметрия А = 0
эксцесс Е =

3
Стандартное нормальное распределение имеет нулевое среднее и единичную дисперсию
Слайд 97

Нормальное распределение Форма, которую надо запомнить!

Нормальное распределение

Форма, которую надо запомнить!

Слайд 98

Нормальное распределение

Нормальное распределение

Слайд 99

Нормальное распределение 68.26% 95.44% 99.74%

Нормальное распределение

68.26%

95.44%

99.74%

Слайд 100

Меры формы Коррупционный всплеск Баллы теста Количество абитуриентов

Меры формы

Коррупционный
всплеск

Баллы теста

Количество абитуриентов

Слайд 101

Нормальное распределение Нормальная кривая человеческих достижений: 2 года – не писать

Нормальное распределение

Нормальная кривая человеческих достижений:
2 года – не писать в штаны
10

лет – иметь много друзей и много тусоваться
20 лет – иметь сексуальные отношения
30 лет – много зарабатывать и иметь крутую тачку
50 лет – много зарабатывать и иметь крутую тачку
60 лет – иметь сексуальные отношения
70 лет – иметь много друзей и много тусоваться
78 лет – не писать в штаны
Слайд 102

Какую меру выбрать?

Какую меру выбрать?

Слайд 103

Какую меру выбрать? Медиана используется когда 1) распределение асимметрично 2) есть

Какую меру выбрать?

Медиана используется когда
1) распределение асимметрично
2) есть опасность перекоса

из-за экстремальных значений. Медиана не чувствительна к экстремальным значениям, в то время как среднее очень чувствительно.
3)медиану можно вычислять для данных шкалы порядка и выше.
Слайд 104

Что мы должны знать? Как строить частотные таблицы и графики Меры

Что мы должны знать?

Как строить частотные таблицы и графики
Меры центральной тенденции
Меры

изменчивости
2) Меры положения
3) Меры формы
4) Свойства нормального распределения
Слайд 105

Полезная литература: К следующей лекции прочитать: Clay Helberg: Pitfalls of Data

Полезная литература:

К следующей лекции прочитать:
Clay Helberg: Pitfalls of Data Analysis
(or How

to Avoid Lies and Damned Lies)
Barnett A. How Numbers can trick you// Technology Review, October 1994 (на русском)
(есть в эл.виде в папке
«Дополнительная литература»)