Представление данных

Содержание

Слайд 2

2.1. Частоты и распределения частот Частота – количество наблюдений, в которых

2.1. Частоты и распределения частот

Частота – количество наблюдений, в которых признак

принимает определенное значение или находится в определенном интервале.

Если признак номинальный, порядковый или дискретный количественный, то дискретное распределение частот – это таблица, в которой приведены все значения признака и частоты, с которой они встречаются в выборке.
Если признак непрерывный количественный, то интервальное распределение частот состоит из некоторого количества интервалов равной длины, на которые делится весь диапазон изменения признака, и соответствующих этим интервалам частот.

Слайд 3

Пример. Политические предпочтения Имеются исходные данные по респондентам: Респондент Предпочтение 1

Пример. Политические предпочтения

Имеются исходные данные по респондентам:
Респондент Предпочтение
1 демократы
2 демократы
3 либералы
4 демократы
5 коммунисты
6 либералы
7 коммунисты
… …
105 демократы
всего 105 респондентов

Требуется получить распределение

частот.
Слайд 4

Дискретное распределение Номинальная шкала Политические предпочтения Порядковая шкала Отношение к фильму

Дискретное распределение

Номинальная шкала
Политические предпочтения

Порядковая шкала
Отношение к фильму

Слайд 5

Интервальное распределение частот Интервальное распределение частот состоит из некоторого количества интервалов

Интервальное распределение частот

Интервальное распределение частот состоит из некоторого количества интервалов равной

длины, на которые делится весь диапазон изменения признака, и соответствующих этим интервалам частот.

Данные о весе
77 человек

Слайд 6

Условия для выбора интервалов 1. Интервалы не должны пересекаться 2. Интервалы

Условия для выбора интервалов

1. Интервалы не должны пересекаться
2. Интервалы должны

охватывать все значения признака
3. Интервалы должны иметь одинаковую длину, за исключением крайних
4. Интервалы не должны иметь пробелов
Слайд 7

Иногда вместо абсолютных частот в таблицах указываются относительные частоты или проценты

Иногда вместо абсолютных частот в таблицах указываются
относительные частоты или проценты

Слайд 8

Расчет относительных частот Обозначения: f = частота P = относительная частота

Расчет относительных частот

Обозначения:
f = частота
P = относительная частота
CP

= накопленная относительная частота
% = проценты
С% = накопленные проценты
Слайд 9

Пример. Политические предпочтения f – абсолютная частота (45) P – относительная

Пример. Политические предпочтения

f – абсолютная частота (45)

P – относительная частота

(45/105 = 0,428)

% – процент (45/105*100% = 42,8%)

Слайд 10

Пример. Отметки по математике - накопленные значения (сумма с 1-ой строки

Пример. Отметки по математике

- накопленные значения (сумма с 1-ой строки по

данную)

58 учеников (или 0.682 всех учеников, или 68.2%
всех учеников) имеют оценку хорошо и выше

Слайд 11

2.4. Визуальные представления Графические изображения данных дают визуальное представление об основных

2.4. Визуальные представления

Графические изображения данных дают визуальное представление об основных свойствах

имеющегося набора данных:
1. Размах значений. Минимальное и максимальное значения.
2. Типичные значения. Какие значения встречаются чаще всего?
3. Общая конфигурация данных. Где сосредоточены основные данные? Симметрично ли они расположены вокруг типичного значения? В какую сторону смещены?
4. Характерные особенности. Имеются ли выбросы? Есть ли значения, которые пропущены?
Слайд 12

Гистограммы частот Гистограмма частот – графическое представление, которое показывает распределение переменной.

Гистограммы частот

Гистограмма частот – графическое представление, которое показывает распределение переменной.

Слайд 13

Гистограммы. Примеры (1) Политические предпочтения Проценты Абсолютная частота

Гистограммы. Примеры (1)

Политические предпочтения

Проценты

Абсолютная частота

Слайд 14

Гистограммы. Примеры (2) Отметки по математике (абсолютная частота)

Гистограммы. Примеры (2)

Отметки по математике

(абсолютная частота)

Слайд 15

Пример. Тест первокурсников Первокурсники экономических факультетов написали тест по математике. В

Пример. Тест первокурсников

Первокурсники экономических факультетов написали тест по математике. В тесте

приняли участие 331 человек. Оценивалось 11 заданий.
Слайд 16

Нормальное распределение Анализ данных наиболее эффективен в случае, когда гистограмма близка

Нормальное распределение

Анализ данных наиболее эффективен в случае, когда гистограмма близка к

нормальному распределению.
На гистограмме нарисована линия для нормального распределения со средним 4,3.
Слайд 17

Бимодальное распределение Если в гистограмме видны две отдельные группы данных, говорят

Бимодальное распределение

Если в гистограмме видны две отдельные группы данных, говорят

о бимодальном распределении данных.
Возможно, следует изменить ход анализа:
1 вариант - отказаться от изучения одной из групп
2 вариант - изменить подход к сбору и анализу данных

Пример. Продолжительность пребывания больных в стационаре

Слайд 18

Выбросы Сильно отклоняющиеся значения называются выбросами. Следует решить, отказаться от выбросов

Выбросы

Сильно отклоняющиеся значения называются выбросами.
Следует решить, отказаться от выбросов в

дальнейшем исследовании или нет. Можно провести два исследования параллельно – с выбросами и без. Если выбросы исключаются, это должно быть аргументировано и детально описано в отчете.

Пример. Время обслуживания одного клиента

Слайд 19

Полигоны частот Полигон, в отличие от гистограммы, строится в виде линии,

Полигоны частот

Полигон, в отличие от гистограммы, строится в виде линии, проходящей

по точкам, соответствующим серединам интервалов и частотам.
Зрительное представление о распределении частот, полученное при помощи полигона, довольно сильно отличается от гистограммы даже при одних и тех же данных.
Слайд 20

Кумулята Кумулята позволяет при помощи графика ответить на вопрос, сколько человек

Кумулята

Кумулята позволяет при помощи графика ответить на вопрос, сколько человек имеет

4 и менее решенных задач.
Слайд 21

Кумулята Кумулята позволяет при помощи графика ответить на вопрос, сколько человек имеет вес до 70 кг.

Кумулята

Кумулята позволяет при помощи графика ответить на вопрос, сколько человек имеет

вес до 70 кг.