Виды данных. Лекция 3

Содержание

Слайд 2

План лекции Критерии измерений Виды данных Типы шкал

План лекции

Критерии измерений
Виды данных
Типы шкал

Слайд 3

Измерения и шкалы Измерение (measurement) означает присвоение чисел характеристикам изучаемых объектов,

Измерения и шкалы

Измерение (measurement) означает присвоение чисел характеристикам изучаемых объектов, явлений

согласно некоторому правилу
Шкала (scale) есть правило (или алгоритм), в соответствии с которым изучаемым объектам, явлениям присваиваются числа
Слайд 4

Данные (data) - результаты наблюдений, испытаний, накапливаемые с целью последующего изучения

Данные (data)

- результаты наблюдений, испытаний, накапливаемые с целью последующего изучения и

анализа.
Респондент Возраст Пол Образование Семейное положен.
1 29 0 12 2
2 23 1 14 1
3 37 1 16 2
4 46 0 10 4
5 34 1 14 1
Слайд 5

Переменная Переменная - признак (исследуемого объекта), который может принимать разные значения

Переменная

Переменная - признак (исследуемого объекта), который может принимать разные значения

для различных случаев или для различных моментов времени в рамках одного случая.
Признак - характеристика предмета или явления, по которым его отличают от других предметов или явлений.
Признак - свойство или характеристика изучаемого явления, выраженные в совокупности переменных, которые могут быть подвергнуты наблюдению и измерению.
Слайд 6

Типы признаков: Качественные, категориальные: - номинальные - дихотомические - порядковые, ординальные,

Типы признаков:

Качественные, категориальные:
- номинальные
- дихотомические
- порядковые, ординальные, ранжируемые
Количественные, интервальные
- дискретные
-

непрерывные
Слайд 7

Номинальная шкала (nominal scale) [лат. nominalis именной] состоит из названий, имен

Номинальная шкала (nominal scale) [лат. nominalis именной]

состоит из названий, имен или

категорий для сортировки или классификации объектов, явлений по некоторому признаку.
Результаты измерений, полученные при помощи номинальной шкалы, не могут быть упорядочены и с ними не могут производиться арифметические операции.
Приведите примеры
Слайд 8

Качественные, категориальные номинальные не поддающиеся непосредственному измерению не могут быть упорядочены

Качественные, категориальные номинальные

не поддающиеся непосредственному измерению
не могут быть упорядочены
с ними не

могут производиться арифметические операции
диагноз, профессия, семейное положение
Слайд 9

Качественные, категориальные дихотомические (binary) Могут быть отнесены только к двум противоположным

Качественные, категориальные дихотомические (binary)

Могут быть отнесены только к двум противоположным категориям,

принимающие одно из двух значений
Приведите примеры
Слайд 10

Дихотомическая шкала (dichotomous scale) Номинальная шкала, которая состоит из двух категорий. да/нет, жив/умер, курит/не курит

Дихотомическая шкала (dichotomous scale)

Номинальная шкала, которая состоит из двух категорий.
да/нет,

жив/умер, курит/не курит
Слайд 11

Качественные, категориальные порядковые (ordinal) Можно расположить в естественном порядке, но отсутствует

Качественные, категориальные порядковые (ordinal)

Можно расположить в естественном порядке, но отсутствует количественная

мера расстояния между величинами
Приведите примеры
Слайд 12

Порядковая шкала (ordinal scale) числа присваиваются объектам, чтобы обозначить относительные позиции

Порядковая шкала (ordinal scale)

числа присваиваются объектам, чтобы обозначить относительные позиции

объектов, но не величину различий между ними.
Степень тяжести
Стадия болезни
Самооценка состояния здоровья
Слайд 13

Интервальная шкала (interval scale) позволяет находить разницу между двумя величинами. Обладает

Интервальная шкала (interval scale)

позволяет находить разницу между двумя величинами. Обладает

всеми свойствами номинальной и порядковой, но она позволяет указать количественное значение измеряемого признака. Недостатком служит отсутствие абсолютного нуля в качестве точки отсчета.
Приведите примеры
Слайд 14

Количественные или интервальные Признаки, количественная мера которых четко определена Т, САД,

Количественные или интервальные

Признаки, количественная мера которых четко определена
Т, САД, ДАД, рост,

вес, уровень холестерина, количество беременностей, дни нетрудоспособности
Какие из них непрерывные, какие – дискретные?
Слайд 15

Количественные непрерывные Принимают любое значение на непрерывной шкале Масса тела, температура, биохимические показатели крови

Количественные непрерывные

Принимают любое значение на непрерывной шкале
Масса тела, температура, биохимические

показатели крови
Слайд 16

Количественные дискретные Принимают лишь определенные значения из диапазона измерения, обычно целые

Количественные дискретные

Принимают лишь определенные значения из диапазона измерения, обычно целые
Число детей

в семье, число заболеваний у одного больного, число выкуриваемых сигарет
Слайд 17

Относительная шкала (ratio scale) обладает абсолютным нулем в качестве точки отсчета,

Относительная шкала (ratio scale)

обладает абсолютным нулем в качестве точки отсчета,

что позволяет ей иметь все свойства интервальной шкалы. Для данных этой шкалы осмысленными являются все операции, включая вычитание и дроби.
время на выполнение теста по математике
Слайд 18

Шкалы – подведем итог Номинальная Дихотомическая Порядковая Интервальная Относительная Содержит только

Шкалы – подведем итог

Номинальная
Дихотомическая
Порядковая
Интервальная
Относительная

Содержит только категории, данные

не могут упорядочиваться
Разновидность номинальной. Содержит всего две категории
Содержит категории, которые могут упорядочиваться, разности не имеют смысла
Разности между значениями могут быть вычислены, но отсутствует точка отсчета
Имеется точка отсчета, возможны отношения между значениями
Слайд 19

Результаты забега на скачках: Дихотомический признак. Эта лошадь пришла первой? 0

Результаты забега на скачках:

Дихотомический признак. Эта лошадь пришла первой?
0 –

нет, 1- да
Порядковый. Какой эта лошадь пришла на финиш?
1 – первой, 2 – второй, 3 – третьей и т.д.
Количественный признак. Какой результат у этой лошади?
60 сек., и т.д.
Слайд 20

Производные (вторичные) данные Проценты. Состояние больного улучшилось на 24 % после

Производные (вторичные) данные

Проценты. Состояние больного улучшилось на 24 % после лечения,

т.е имеет значение степень улучшения, а не абсолютные данные
Пропорции или отношения. Индекс массы тела
Интенсивность. Относительная частота заболеваний, где кол-во заболеваний делят на общее число лет, в течение которых вели наблюдения за пациентами
Метки, оценки используют, когда невозможно измерить количество. Н-р, опросники качества жизни
Слайд 21

Цензурированные данные Если мы используем прибор, который может обнаружить значения только

Цензурированные данные

Если мы используем прибор, который может обнаружить значения только выше

некоторого предельного уровня, тогда любая величина ниже этого уровня не будет обнаружена
Когда некоторые больные из основной группы отстраняются от испытания до окончания исследований
Слайд 22

РЕДУКЦИЯ ДАННЫХ уменьшение числа категорий в наборе данных для упрощения анализа.

РЕДУКЦИЯ ДАННЫХ

уменьшение числа категорий в наборе данных для упрощения анализа.


суммирование данных посредством классификационных схем и арифметических действий.
- суммирование набора или наборов данных в форме индекса, например, ожидаемой продолжительности жизни или валового внутреннего продукта.
Слайд 23

Редукция данных: Возраст: Годы (16 лет) – количественный признак Десятилетия (10-20

Редукция данных:

Возраст:
Годы (16 лет) – количественный признак
Десятилетия (10-20 лет) – интервальный
Периоды

(юношество) – ординальный
Молодой, подросток - номинальный