Дискриминантный анализ

Содержание

Слайд 2

Задачи дискриминантного анализа Задачи первого типа часто встречаются в торговле. Допустим,

Задачи дискриминантного анализа

Задачи первого типа часто встречаются в торговле.
Допустим,

что мы располагаем информацией о некотором числе покупателей и совершенных покупках. На основе этой информации нужно найти функцию, позволяющую поставить в соответствие новым покупателям характерные для их соц.-дем. статуса покупки.
Построение такой функции и составляет задачу дискриминации.
Слайд 3

Задачи дискриминантного анализа Второй тип задач относится к ситуации, когда признаки

Задачи дискриминантного анализа

Второй тип задач относится к ситуации, когда признаки

принадлежности покупателя к той или иной группе потеряны, и их нужно восстановить.
Примером может служить определение возрастной группы покупателей по истории совершенных покупок.
Слайд 4

Задачи дискриминантного анализа Задачи третьего типа связаны с предсказанием будущих событий

Задачи дискриминантного анализа

Задачи третьего типа связаны с предсказанием будущих событий

на основании имеющихся данных.
Такие задачи возникают при прогнозе покупок, трафика. Например, прогноз вероятности посещения ТРЦ определенной группой покупателей
Слайд 5

Задачи дискриминантного анализа Целью задачи дискриминации является изучение основных процедур дискриминантного

Задачи дискриминантного анализа

Целью задачи дискриминации является изучение основных процедур дискриминантного

анализа:
дискриминации и классификации
построение и определение количества дискриминантных функций и их разделительной способности
нахождение классифицирующих функций
Слайд 6

Результаты ДА Основным результатом проведения дискриминантного анализа являются рассчитанные вероятности попадания

Результаты ДА

Основным результатом проведения дискриминантного анализа являются рассчитанные вероятности попадания каждого

респондента в ту или иную группу, а также переменная, кодирующая принадлежность их к данным группам.
Наряду с этой информацией по результатам дискриминантного анализа можно составить уравнение дискриминантной функции.
Слайд 7

Дискриминантный анализ

Дискриминантный анализ

Слайд 8

Зависимая переменная При выборе зависимой переменной (Y) для дискриминантного анализа следует

Зависимая переменная

При выборе зависимой переменной (Y) для дискриминантного анализа следует помнить,

что увеличение числа категорий в ней влечет уменьшение точности и надежности модели.
Поэтому рекомендуется использовать в качестве зависимых переменные с малым количеством категорий (2-3), например:
Посетит – не посетит
Купит – не купит
Пол
Вид занятости
Слайд 9

ПРИМЕР Проводится маркетинговое исследование потенциального спроса на услуги нового ТРЦ. Респонденты

ПРИМЕР

Проводится маркетинговое исследование потенциального спроса на услуги нового ТРЦ.
Респонденты в

ходе опроса отвечают на вопрос Будете ли Вы посещать новый комплекс? с вариантами ответа Да и Нет. В качестве независимых переменных, характеризующих респондентов, выделены:
■ возраст ; ■ занятость; ■ среднемесячный доход на члена семьи; ■ количество членов семьи; ■ среднемесячные расходы на досуг; ■ пол.
Слайд 10

Зависимая переменная В результате дискриминантного анализа разделим респондентов: на посетителей не

Зависимая переменная

В результате дискриминантного анализа разделим респондентов:
на посетителей
не посетителей нового

центра
на основании выделенных социально-демографических характеристик опрошенных.
Слайд 11

Скрин. Дискриминантный анализ

Скрин. Дискриминантный анализ

Слайд 12

Скрин. Дискриминантный анализ

Скрин. Дискриминантный анализ

Слайд 13

Скрин. Дискриминантный анализ

Скрин. Дискриминантный анализ

Слайд 14

Скрин. Дискриминантный анализ

Скрин. Дискриминантный анализ

Слайд 15

Скрин. Дискриминантный анализ

Скрин. Дискриминантный анализ

Слайд 16

Скрин. Статистики

Скрин. Статистики

Слайд 17

Скрин. Статистики

Скрин. Статистики

Слайд 18

Скрин. Статистики

Скрин. Статистики

Слайд 19

Выбор анализа дискриминантной функции Теперь вернемся к первичной цели анализа. Нажмем

Выбор анализа дискриминантной функции

Теперь вернемся к первичной цели анализа. Нажмем на

кнопку Отмена в диалоговом окне Описательные статистики для того, чтобы вернуться к диалоговому окну Определение Модели.
Для того чтобы увидеть, что происходит на каждом шаге дискриминантного анализа, необходимо выполнить пошаговый анализ.
Во вкладке Дополнительно, в списке Метод установите значение Пошаговый с включением. При такой установке программа будет вводить переменные одну за другой, каждый раз выбирая переменную, вносящую наибольший вклад в дискриминацию.
Слайд 20

Анализ

Анализ

Слайд 21

Анализ Теперь нажмем на кнопку Переменные в модели для обзора независимых

Анализ

Теперь нажмем на кнопку Переменные в модели
для обзора независимых вкладов

каждой переменной
в общую дискриминацию
Слайд 22

Анализ Наибольшее влияние на готовность посетить ТРЦ оказывают: ВозрастКат, Занятость, Человек

Анализ

Наибольшее влияние на готовность посетить ТРЦ оказывают:
ВозрастКат, Занятость, Человек в семье

и Затраты на отдых
Чем меньше частная статистика Уилкса лямбда,
тем больше вклад в общую дискриминацию
Слайд 23

Анализ Если толерантность имеет значение, меньшее, чем значение по умолчанию 0.01

Анализ

Если толерантность имеет значение, меньшее, чем значение по умолчанию 0.01 (или

установленное специально пользователем), то эта переменная признается неинформативной и не включается в модель, поскольку не несет дополнительной информации по сравнению с остальными переменными.
Слайд 24

Проверка значимости Значимость корней. Сначала определим, является ли дискриминантная функция статистически

Проверка значимости

Значимость корней. Сначала определим, является ли дискриминантная функция статистически значимой.

Нажмите на кнопку Критерий Хи-квадрат последовательных корней и увидите следующую таблицу:
Слайд 25

Анализ дискриминирующих переменных Дискриминантная функция значима р

Анализ дискриминирующих переменных

Дискриминантная функция значима р << 0,01.

Слайд 26

Анализ дискриминирующих переменных Канонический анализ. Чтобы увидеть, как четыре переменные разделяют

Анализ дискриминирующих переменных

Канонический анализ. Чтобы увидеть, как четыре переменные разделяют посетителей,

вычислим действительную дискриминантную функцию.
Нажмите на кнопку →Коэффициенты для канонических переменных.
Слайд 27

Коэффициенты дискриминантной функции Нажмите на кнопку Коэффициенты для канонических переменных в

Коэффициенты дискриминантной функции

Нажмите на кнопку Коэффициенты для канонических переменных в диалоговом

окне Канонический анализ.
Будут получены две таблицы, одна для Исходных коэффициентов и другая для Стандартизованных коэффициентов.
Слайд 28

Решение Исходные коэффициенты Уравнение дискриминантной функции имеет вид: План=-0,625×ВозрастКат - 0,552×Занятость - 0,346×Чел + 0,148×Отдых +3,213

Решение

Исходные коэффициенты
Уравнение дискриминантной функции имеет вид:

План=-0,625×ВозрастКат - 0,552×Занятость - 0,346×Чел +

0,148×Отдых +3,213
Слайд 29

Решение Стандартизованные коэффициенты - это те коэффициенты, которые обычно используются для

Решение

Стандартизованные коэффициенты - это те коэффициенты, которые обычно используются для интерпретации,

так как они относятся к нормированным переменным и поэтому должны находиться в сравнимых масштабах
Слайд 30

Применение Можно сделать вывод о том, что наиболее вероятные посетители ТРЦ:

Применение

Можно сделать вывод о том, что наиболее вероятные посетители ТРЦ: более

молоды, не имеют полной занятости, из малой семьи и больше других тратят на отдых

Интерпретация вычисленных
по формуле значений:

-0,697 ВозрастКат
0,471 Занятость
0,1217 Чел
+ 0,305 Отдых

Слайд 31

Вывод результатов Нажмите на кнопку Функции классификации во вкладке Классификация диалогового

Вывод результатов

Нажмите на кнопку Функции классификации во вкладке Классификация диалогового окна

Результаты анализа дискриминантных функций для того, чтобы увидеть эти функции.
Слайд 32

Вывод результатов

Вывод результатов

Слайд 33

Вывод результатов Нажмите на кнопку Матрица классификации во вкладке Классификация диалогового окна Результаты анализа дискриминантных функций

Вывод результатов

Нажмите на кнопку Матрица классификации во вкладке Классификация диалогового окна

Результаты анализа дискриминантных функций
Слайд 34

Вывод результатов В первом столбце таблицы вы видите процент наблюдений, которые

Вывод результатов

В первом столбце таблицы вы видите процент наблюдений, которые были

правильно классифицированы для каждой совокупности полученными функциями классификации.
Потенциальные посетители нового ТРЦ (Да) определяются функцией с вероятностью 74% 159/(55+159)
Слайд 35

Точность модели Результаты оценки корректности классификации варьируют в пределах от 50

Точность модели

Результаты оценки корректности классификации варьируют в пределах от 50 %

до 100 %.
Получен результат для потенциальных посетителей — 74 %