Дискриминантный анализ

Содержание

Слайд 2

Цели В каких случаях применяется дискриминантный анализ Как применить дискриминантный анализ Как интерпретировать результаты дискриминантного анализа

Цели

В каких случаях применяется дискриминантный анализ
Как применить дискриминантный анализ
Как интерпретировать результаты

дискриминантного анализа
Слайд 3

Выбор метода прогнозирования

Выбор метода прогнозирования

Слайд 4

Выбор метода прогнозирования Простая линейная регрессия

Выбор метода прогнозирования

Простая линейная регрессия

Слайд 5

Выбор метода прогнозирования Множественная линейная регрессия

Выбор метода прогнозирования

Множественная
линейная регрессия

Слайд 6

Выбор метода прогнозирования Дискри-минантный анализ

Выбор метода прогнозирования

Дискри-минантный анализ

Слайд 7

Шкалы наименований Мы уже знаем, что можно использовать дихотомические шкалы. А

Шкалы наименований

Мы уже знаем, что можно использовать дихотомические шкалы.
А что делать,

если попалась шкала наименований?
Не спешите расстраиваться! Надо ее просто перекодировать!
Слайд 8

Дискриминантный анализ Альтернатива множественного регрессионного анализа для случая, когда зависимая переменная качественная (категориальная).

Дискриминантный анализ

Альтернатива множественного регрессионного анализа для случая, когда зависимая переменная качественная

(категориальная).
Слайд 9

Дискриминантный анализ Основная цель: Выявление структуры исследуемого множества объектов (структура –

Дискриминантный анализ

Основная цель:
Выявление структуры исследуемого множества объектов
(структура – набор основных факторов

(шкал), по которым различаются и могут быть описаны объекты)
Слайд 10

Основная задача По значениям дискриминантных переменных для объектов получить значения классифицирующей

Основная задача

По значениям дискриминантных переменных для объектов получить значения классифицирующей переменной,

то есть определить классы, в которые попадают эти объекты.
Слайд 11

Основная задача На основании некоторых признаков (независимых переменных) объект или индивидуум

Основная задача

На основании некоторых признаков (независимых переменных) объект или индивидуум может

быть причислен к одной из двух (или к одной из нескольких) заранее заданных групп.
Слайд 12

Ограничения В случае дискриминантного анализа предполагается, что зависимая переменная одна и

Ограничения

В случае дискриминантного анализа предполагается, что
зависимая переменная одна и представлена

в шкале наименований
независимых переменных несколько
Слайд 13

Представление данных

Представление данных

Слайд 14

Основная идея Дискриминантная функция z=b1⋅x1+b2⋅x2+b3⋅x3+…+bn⋅xn+b0

Основная идея

Дискриминантная функция
z=b1⋅x1+b2⋅x2+b3⋅x3+…+bn⋅xn+b0

Слайд 15

Основная идея Наша цель: Определить коэффициенты b, чтобы по значениям дискриминантной

Основная идея

Наша цель:
Определить коэффициенты b, чтобы по значениям дискриминантной функции

можно было с максимальной четкостью провести разделение по группам.
Слайд 16

Пример для двух групп

Пример для двух групп

Слайд 17

Основная идея Строим дискриминантную функцию z=b1⋅x1+b2⋅x2+b3⋅x3+…+bn⋅xn+b0, такую, что разница между средними

Основная идея

Строим дискриминантную функцию
z=b1⋅x1+b2⋅x2+b3⋅x3+…+bn⋅xn+b0,
такую, что разница между средними значениями z1 и

z2, полученными на множествах значений НП для разных групп максимальна.
Слайд 18

Основная идея ⏐z1 - z2⏐ ⇒максимум Фишер показал, что b=S-1⋅(x1-x2), где S – ковариационная матрица

Основная идея

⏐z1 - z2⏐ ⇒максимум

Фишер показал, что
b=S-1⋅(x1-x2),
где S – ковариационная

матрица
Слайд 19

Основная идея Классификация происходит посредством определения величины zГР zГР = (z1 - z2 )/2 zГР

Основная идея

Классификация происходит посредством определения величины zГР
zГР = (z1 -

z2 )/2

zГР

Слайд 20

Основная идея Предположив, что z1 – большее их двух средних, получаем

Основная идея

Предположив, что z1 – большее их двух средних, получаем правило:
Случай

относится к группе 1, если zi - zГР >0
Случай относится к группе 2, если zi - zГР ≤0
Слайд 21

Основная идея z1 и z2 называются центроидами групп

Основная идея

z1 и z2 называются центроидами групп

Слайд 22

Пример для двух групп Данные GENDER – пол испытуемого; EDUC –

Пример для двух групп

Данные
GENDER – пол испытуемого;
EDUC – образование испытуемого (количество

лет, которые бедняга потратил на учебу);
JCAT – вид профессиональной деятельности (1 – клерк, 2- охранник, 3 – менеджер); SALARY – зарплата в настоящий момент;
Слайд 23

Пример для двух групп Данные SAL_BEG – начальная зарплата на этой

Пример для двух групп

Данные
SAL_BEG – начальная зарплата на этой работе;
JTIME

– трудовой стаж на данном рабочем месте (число месяцев);
PREVEX – предыдущий опыт – стаж до поступления на данную работу;
MINORITY – принадлежит ли испытуемый к национальному меньшинству (0 – нет, 1 – да).
Слайд 24

Пример для двух групп Попробуем предсказать, принадлежит ли человек к национальному

Пример для двух групп

Попробуем предсказать, принадлежит ли человек к национальному меньшинству

на основании его зарплаты и образования
Слайд 25

Пример для двух групп Что мы получим в результате применения дискриминантного анализа? Как это интерпретировать?

Пример для двух групп

Что мы получим в результате применения дискриминантного анализа?
Как

это интерпретировать?
Слайд 26

Модуль дискриминантного анализа Discriminant Analysis Statistics ⇒ Multivariate Exploratory Techniques ⇒ Discriminant Analysis

Модуль дискриминантного анализа

Discriminant Analysis
Statistics ⇒
Multivariate Exploratory Techniques ⇒
Discriminant Analysis

Слайд 27

Модуль дискриминантного анализа

Модуль дискриминантного анализа

Слайд 28

Модуль дискриминантного анализа

Модуль дискриминантного анализа

Слайд 29

Модуль дискриминантного анализа

Модуль дискриминантного анализа

Слайд 30

Получаем результаты (Quick): Анализ переменных, использующихся в модели

Получаем результаты (Quick):

Анализ переменных, использующихся в модели

Слайд 31

Variables in the Model: Лямбда Уилкса для модели с исключенной данной

Variables in the Model:

Лямбда Уилкса для модели с исключенной данной переменной.

Изменяется от 0 (совершенное различение) до 1 (никакого различия)
Слайд 32

Variables in the Model: Эта лямбда связана с вкладом данной переменной в различительную силу модели

Variables in the Model:

Эта лямбда связана с вкладом данной переменной в

различительную силу модели
Слайд 33

Variables in the Model: Статистика дисперсионного анализа, показывающая вклад данной переменной в общее «дело» различения групп.

Variables in the Model:

Статистика дисперсионного анализа, показывающая вклад данной переменной в

общее «дело» различения групп.
Слайд 34

Variables in the Model: Толерантность – измеряет избыточность данной переменной. Толерантность

Variables in the Model:

Толерантность – измеряет избыточность данной переменной.

Толерантность 0,34

означает, что переменная на 66% объясняет то, что и другие переменные модели
Слайд 35

Результаты анализа (Advanced) Расстояния между группами

Результаты анализа (Advanced)

Расстояния между группами

Слайд 36

Distances between groups Расстояние Махаланобиса между группами

Distances between groups

Расстояние Махаланобиса между группами

Слайд 37

Distances between groups Значение дисперсионного анализа и соответствующий уровень значимости для оценки расстояния между группами

Distances between groups

Значение дисперсионного анализа и соответствующий уровень значимости для оценки

расстояния между группами
Слайд 38

Результаты анализа (Advanced) Канонический анализ и графики

Результаты анализа (Advanced)

Канонический анализ и графики

Слайд 39

Canonical Analysis:

Canonical Analysis:

Слайд 40

Canonical Analysis (Advanced):

Canonical Analysis (Advanced):

Слайд 41

Canonical Analysis (Advanced): Коэффициенты дискриминантной функции

Canonical Analysis (Advanced):

Коэффициенты дискриминантной функции

Слайд 42

Canonical Analysis (Advanced): z=0,043*educ+0,044*salary+ +0,030*sal_beg-2,605

Canonical Analysis (Advanced):

z=0,043*educ+0,044*salary+
+0,030*sal_beg-2,605

Слайд 43

Canonical Analysis (Advanced): z=0,124*educ+0,720*salary+ +0,230*sal_beg

Canonical Analysis (Advanced):

z=0,124*educ+0,720*salary+
+0,230*sal_beg

Слайд 44

Canonical Analysis (Advanced):

Canonical Analysis (Advanced):

Слайд 45

Canonical Analysis (Advanced): Корреляция переменных с дискриминантной фукцией

Canonical Analysis (Advanced):

Корреляция переменных с дискриминантной фукцией

Слайд 46

Canonical Analysis (Advanced): Центроиды групп (ненормированные)

Canonical Analysis (Advanced):

Центроиды групп
(ненормированные)

Слайд 47

Canonical Analysis (Advanced): zГР=(0,096-0,342)/2

Canonical Analysis (Advanced):

zГР=(0,096-0,342)/2

Слайд 48

Пример для двух групп zГР=(0,096-0,342)/2 = -0,123 -0,123 цветной белый

Пример для двух групп

zГР=(0,096-0,342)/2 = -0,123

-0,123

цветной

белый

Слайд 49

Canonical Analysis (Canonical Scores): Значения дискриминантной функции для каждого случая

Canonical Analysis (Canonical Scores):

Значения дискриминантной функции для каждого случая

Слайд 50

Canonical Analysis (Canonical Scores):

Canonical Analysis (Canonical Scores):

Слайд 51

Результаты анализа (Classification): Функции классификации

Результаты анализа (Classification):

Функции
классификации

Слайд 52

Результаты анализа (Classification): Значения этих функций вычисляются для каждой группы и

Результаты анализа (Classification):

Значения этих функций вычисляются для каждой группы и служат

для прямой классификации. Случай попадает в группу, для которой у него получается наибольшее значение
Слайд 53

Результаты анализа(Classification): Априорные вероятности попасть к данную группу (по умолчанию вычисляются исходя из размеров группы)

Результаты анализа(Classification):

Априорные вероятности попасть к данную группу (по умолчанию вычисляются исходя

из размеров группы)
Слайд 54

Результаты анализа: Это очень полезная матрица!

Результаты анализа:

Это очень полезная матрица!

Слайд 55

Результаты анализа (Classification): Очень важный показатель! Процент правильно предсказанных значений

Результаты анализа (Classification):

Очень важный показатель! Процент правильно предсказанных значений

Слайд 56

Результаты анализа (Classification):

Результаты анализа (Classification):

Слайд 57

Результаты анализа (Classification):

Результаты анализа (Classification):

Слайд 58

Результаты анализа (Classification):

Результаты анализа (Classification):

Слайд 59

Пример для двух групп

Пример для двух групп

Слайд 60

Пример для трех групп Посмотрим, можем ли мы предсказать, на какой

Пример для трех групп

Посмотрим, можем ли мы предсказать, на какой должности

работает человек по его зарплате, образованию и принадлежности к национальному меньшинству.
Слайд 61

Пример для трех групп В этом случае одной дискриминантной функцией не обойдешься! Их будет две.

Пример для трех групп

В этом случае одной дискриминантной функцией не обойдешься!
Их

будет две.
Слайд 62

Пример для трех групп Группа 2 Группа 1 Группа 3

Пример для трех групп

Группа 2

Группа 1

Группа 3

Слайд 63

Пример для трех групп

Пример для трех групп

Слайд 64

Пример для трех групп

Пример для трех групп

Слайд 65

Пример для трех групп

Пример для трех групп

Слайд 66

Пример для трех групп

Пример для трех групп

Слайд 67

Пример для трех групп Теперь можно посмотреть красивый график

Пример для трех групп

Теперь можно посмотреть красивый график

Слайд 68

Пример для трех групп

Пример для трех групп

Слайд 69

Пример для трех групп

Пример для трех групп

Слайд 70

Результаты анализа Мы можем оценить, насколько НП определяют ЗП (т.е оценить

Результаты анализа

Мы можем
оценить, насколько НП определяют ЗП (т.е оценить нашу модель)
делать

предсказания (по значениям НП определять, в какую группу попадет объект или индивид)
Слайд 71

Как делать прогноз?

Как делать прогноз?

Слайд 72

Как делать прогноз?

Как делать прогноз?

Слайд 73

Как делать прогноз?

Как делать прогноз?

Слайд 74

Пример (реальный) Проект: Можно ли предсказать тип преступника (насильственный, корыстный или

Пример (реальный)

Проект: Можно ли предсказать тип преступника (насильственный, корыстный или корыстно-насильственный)

по результатам тестов Кеттела и Леонгарда-Шмишека?
Слайд 75

Пример 1) дискриминантный анализ по всем переменным. 2) прямой пошаговый дискриминантный анализ. Получились совершенно потрясающие результаты:

Пример

1) дискриминантный анализ по всем переменным.
2) прямой пошаговый дискриминантный анализ.
Получились

совершенно потрясающие результаты:
Слайд 76

Пример (результаты)

Пример (результаты)

Слайд 77

Пример (результаты)

Пример (результаты)

Слайд 78

Пример (результаты –гм!)

Пример (результаты –гм!)

Слайд 79

Пример (результаты –гм!)

Пример (результаты –гм!)

Слайд 80

Пример (результаты –гм!)

Пример (результаты –гм!)

Слайд 81

Пример (результаты –гм!)

Пример (результаты –гм!)

Слайд 82

Пример

Пример

Слайд 83

Пример

Пример

Слайд 84

Полезная литература ПРОГРАММА STATISTICA Боровиков В. Программа STATISTICA для студентов и

Полезная литература

ПРОГРАММА STATISTICA
Боровиков В. Программа STATISTICA для студентов и инженеров. -

Компьютер Пресс: Москва, 2001.
Электронный учебник по программе (StatSoft)
ПРОГРАММА SPSS
Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. – СПб. – Речь. – 2004.
Бююль А., Цефель П. SPSS: Искусство обработки информации. – СПб, «ЛиаСофтЮп». –2001.
Слайд 85

К практическому занятию по регрессионному анализу надо прочитать: Нестеренко А.И. и

К практическому занятию по регрессионному анализу надо прочитать:
Нестеренко А.И. и др.

Прогноз тревожности у студенток на основании их типологических различий// ПЖ, 2003, т.24, № 6, с. 37-46