Факторный анализ

Содержание

Слайд 2

Факторный анализ Факторный анализ – как религия: каждый находит в нем

Факторный анализ

Факторный анализ – как религия: каждый находит в нем что-то

свое

Под факторным анализом понимают два метода:
Метод главных компонент
Факторный анализ

Слайд 3

Основная идея Метод главных компонент объясняет наибольшую вариативность в терминах наименьшего количества линейных комбинаций переменных.

Основная идея

Метод главных компонент объясняет наибольшую вариативность в терминах наименьшего количества

линейных комбинаций переменных.
Слайд 4

Основная идея Факторный анализ объясняет отношения между переменными с помощью нескольких

Основная идея

Факторный анализ объясняет отношения между переменными с помощью нескольких факторов,

которые не могут быть прямо измерены.
Слайд 5

Основная идея Оба метода основываются на корреляциях (или ковариациях) между исходными

Основная идея

Оба метода основываются на корреляциях (или ковариациях) между исходными переменными

и часто называются одним термином – факторный анализ.
Слайд 6

Основная идея Главными целями факторного анализа являются: (1) сокращение числа переменных

Основная идея

Главными целями факторного анализа являются: (1) сокращение числа переменных и

(2) определение структуры взаимосвязей между переменными, т.е. классификация переменных.
Слайд 7

Метод главных компонент – это метод, который переводит большое количество связанных

Метод главных компонент

– это метод, который переводит большое количество связанных между

собой (зависимых, коррелирующих) переменных в меньшее количество независимых переменных.
Слайд 8

Метод главных компонент ПРИМЕР: у студентов измерили интеллект по тесту Векслера,

Метод главных компонент

ПРИМЕР: у студентов измерили
интеллект по тесту Векслера,


интеллект по тесту Айзенка,
интеллект по тесту Равена,
а также
успеваемость по социальной ψ
успеваемость по когнитивной ψ
успеваемость по общей ψ.
Слайд 9

Метод главных компонент Если переменных в исследовании слишком много (x1, x2,

Метод главных компонент

Если переменных в исследовании слишком много (x1, x2, …,

xp), а некоторые из них взаимосвязаны, то у исследователя иногда возникает желание уменьшить сложность данных, сократив количество переменных.
Слайд 10

Метод главных компонент Для этого и служит метод главных компонент, который

Метод главных компонент

Для этого и служит метод главных компонент, который создает

несколько новых переменных y1, y2, …, yp, каждая из которых является линейной комбинацией первоначальных переменных x1, x2, …, xp:
Слайд 11

Метод главных компонент y1=a11x1+a12x2+…+a1pxp y2=a21x1+a22x2+…+a2pxp … (1) yp=ap1x1+ap2x2+…+appxp Это и есть модель для метода главных компонент

Метод главных компонент

y1=a11x1+a12x2+…+a1pxp
y2=a21x1+a22x2+…+a2pxp
… (1)
yp=ap1x1+ap2x2+…+appxp

Это и есть модель для метода главных компонент

Слайд 12

Метод главных компонент Переменные y1, y2, …, yp называются главными компонентами

Метод главных компонент

Переменные y1, y2, …, yp называются главными компонентами или

факторами.
Таким образом, фактор – это искусственный статистический показатель, возникающий в результате специальных преобразований корреляционной матрицы.
Слайд 13

Метод главных компонент Процедура извлечения факторов называется факторизацией матрицы.(проведение ФА). В

Метод главных компонент

Процедура извлечения факторов называется факторизацией матрицы.(проведение ФА).
В результате

факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных.
Слайд 14

Метод главных компонент Коэффициенты aij, определяющие новую переменную, выбираются таким образом,

Метод главных компонент

Коэффициенты aij, определяющие новую переменную, выбираются таким образом, чтобы

новые переменные (главные компоненты, факторы) описывали максимальное количество вариативности данных и не коррелировали между собой.
Слайд 15

Метод главных компонент Часто полезно представить коэффициенты aij таким образом, чтобы

Метод главных компонент

Часто полезно представить коэффициенты aij таким образом, чтобы они

представляли собой коэффициент корреляции между исходной переменной и новой переменной (фактором). Это достигается умножением aij на стандартное отклонение фактора.
Слайд 16

Метод главных компонент Коэффициенты aij называются факторными нагрузками.

Метод главных компонент

Коэффициенты aij называются факторными нагрузками.

Слайд 17

Матрица факторных нагрузок

Матрица факторных нагрузок

Слайд 18

Факторный анализ Основное отличие между факторным анализом и методом главных компонент

Факторный анализ

Основное отличие между факторным анализом и методом главных компонент заключается

в том, что главные компоненты являются линейными функциями от наблюдаемых переменных, в то время как общие факторы не выражаются через комбинацию наблюдаемых переменных.
Слайд 19

Факторный анализ Модель факторного анализа предполагает, что корреляции между наблюдаемыми переменными

Факторный анализ

Модель факторного анализа предполагает, что корреляции между наблюдаемыми переменными x1,

x2, …, xp получаются благодаря их связи с некоторыми фундаментальными переменными, известными как общие факторы или латентные переменные f1, f2, …, fk , где k
Слайд 20

Факторный анализ Дисперсия исходных переменных здесь объясняется не в полном объеме:

Факторный анализ

Дисперсия исходных переменных здесь объясняется не в полном объеме: признается,

что часть дисперсии остается нераспознанной как характерность.
Слайд 21

Факторный анализ x1=λ11f1+ λ 12f2+…+ λ1kfk+u1 x2= λ21f1+ λ 22f2+…+ λ2kfk+u2

Факторный анализ

x1=λ11f1+ λ 12f2+…+ λ1kfk+u1
x2= λ21f1+ λ 22f2+…+ λ2kfk+u2
… (2)
xp= λp1f1+

λ p2f2+…+ λpkfk+up

Это и есть модель факторного анализа

Слайд 22

Факторный анализ Случайная погрешность ui называется характерностью и представляет собой часть

Факторный анализ

Случайная погрешность ui называется характерностью и представляет собой часть наблюдаемой

переменной, которая не объясняется действием факторов.
Слайд 23

Факторный анализ Общность (Communality) переменной xi - является той дисперсией, которую

Факторный анализ

Общность (Communality) переменной xi - является той дисперсией, которую переменная

делит с другими явными переменными посредством их отношения с латентной переменной.

Дисперсия явной переменной может быть разделена на две части:

Характерность - часть единичной дисперсии переменной, которая не связана с общими факторами.

Слайд 24

Факторный анализ Если латентные факторы не коррелируют, то коэффициенты λij являются

Факторный анализ

Если латентные факторы не коррелируют, то коэффициенты λij являются корреляциями

между латентными переменными и явными переменными. Они также называются факторными нагрузками и представляются в виде такой же таблицы, как и факторные нагрузки в методе главных компонент
Слайд 25

Факторный анализ Соответствие факторной модели полученным данным проверяется путем сравнения исходной

Факторный анализ

Соответствие факторной модели полученным данным проверяется путем сравнения исходной корреляционной

матрицы с матрицей корреляций, полученной в результате применения модели. Такая оценка соответствия может быть проведена различными методами.
Слайд 26

Факторный анализ В программе STATISTICA реализовано пять методов факторного анализа:

Факторный анализ

В программе STATISTICA реализовано пять методов факторного анализа:

Слайд 27

Факторный анализ Commonalities=multiple R-square. Если выбран этот метод, то перед факторизацией

Факторный анализ

Commonalities=multiple R-square.
Если выбран этот метод, то перед факторизацией диагональные

элементы корреляционной матрицы (общности) будут вычисляться как множественные коэффициенты корреляции данной переменной со всеми остальными переменными, а затем возводиться в квадрат. Это самый распространенный метод факторного анализа, обычно выбираемый по умолчанию.
Слайд 28

Факторный анализ Iterated commonalities (MINRES). Этот метод отличается от предыдущего тем,

Факторный анализ

Iterated commonalities (MINRES).
Этот метод отличается от предыдущего тем, что

после факторизации оптимизирует факторные нагрузки посредством нескольких итераций, основываясь на оценке квадратов сумм остатков.
Слайд 29

Факторный анализ Maximum likelihood factors метод максимального правдоподобия Д. Лоули. В

Факторный анализ

Maximum likelihood factors
метод максимального правдоподобия Д. Лоули. В отличие

от остальных методов тут предполагается, что число факторов заранее известно (и должно быть установлено в окошке maximum number of factors). Программа затем вычисляет оценки факторных нагрузок и общностей, которые максимизируют вероятность получения исходной корреляционной матрицы.
Слайд 30

Факторный анализ Centroid method – центроидный метод Л. Тэрстоуна. В нем

Факторный анализ

Centroid method
– центроидный метод Л. Тэрстоуна. В нем корреляции

между переменными рассматриваются как пучок векторов, а латентный фактор геометрически представляется как уравновешивающий вектор, проходящий через центр этого пучка. Это наименее современный метод факторного анализа, требующий также наименьшего количества вычислений.
Слайд 31

Факторный анализ Principal axis method В этом методе (методе главных осей)

Факторный анализ

Principal axis method
В этом методе (методе главных осей) на

каждом итерационном шаге собственные значения вычисляются с помощью общностей, затем общности пересчитываются на основании собственных значений. Новые общности помещаются на диагональ корреляционной матрицы, и начинается новый итерационный шаг. Итерации продолжаются либо пока их число не достигнет максимума (заранее определенного), либо пока минимальные изменения в общностях не станут меньше, чем наперед заданные значения.
Слайд 32

Факторный анализ Факторный анализ Statistics ⇒ Multivariate Exploratory Techniques ⇒ Factor Analysis

Факторный анализ

Факторный анализ

Statistics ⇒
Multivariate Exploratory Techniques ⇒ Factor Analysis

Слайд 33

Факторный анализ Разные методы

Факторный анализ

Разные методы

Слайд 34

Факторный анализ ☹ В SPSS реализованы некоторые перечисленные и некоторые другие методы

Факторный анализ

☹ В SPSS реализованы некоторые перечисленные и некоторые другие методы

Слайд 35

Факторный анализ ☺ Но! Факторные отображения одной и той же корреляционной

Факторный анализ

☺ Но! Факторные отображения одной и той же корреляционной матрицы

эквивалентны друг другу, если они содержат одинаковое число факторов.
Практически это значит, что вы получите одни и те же результаты при любом методе.
Слайд 36

Факторный анализ Результаты, полученные с помощью метода главных компонент, и результаты,

Факторный анализ

Результаты, полученные с помощью метода главных компонент, и результаты, полученные

с помощью различных процедур собственно факторного анализа, практически никогда существенно не отличаются друг от друга!


Слайд 37

Сколько факторов? Для применения процедуры выбора следует посчитать некоторую статистику –

Сколько факторов?

Для применения процедуры выбора следует посчитать некоторую статистику – собственные

значения корреляционной матрицы и процент объясненной дисперсии для каждого фактора.
Слайд 38

Сколько факторов?

Сколько факторов?

Слайд 39

Сколько факторов? 1) Процент объясненной дисперсии. Если кумулятивный (накопленный) процент общей

Сколько факторов?


1) Процент объясненной дисперсии. Если кумулятивный (накопленный) процент общей дисперсии

достигает 60% или больше, то можно остановиться на данном количестве факторов.
Слайд 40

Сколько факторов?

Сколько факторов?

Слайд 41

Сколько факторов? 2) Критерий Кайзера (H. Keiser). Вы можете отобрать только

Сколько факторов?


2) Критерий Кайзера (H. Keiser). Вы можете отобрать только факторы

с собственными значениями, большими 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается.
Слайд 42

Сколько факторов?

Сколько факторов?

Слайд 43

Сколько факторов? 3) Критерий каменистой осыпи является графическим методом. Вы можете

Сколько факторов?


3) Критерий каменистой осыпи является графическим методом. Вы можете изобразить

собственные значения, представленные в таблице ранее, в виде простого графика:
Слайд 44

Сколько факторов?

Сколько факторов?


Слайд 45

Сколько факторов? 4) На практике возникает важный дополнительный вопрос, а именно:

Сколько факторов?


4) На практике возникает важный дополнительный вопрос, а именно: когда

полученное решение может быть содержательно интерпретировано.


Слайд 46

Вращение матрицы факторных нагрузок Оказывается, что описанные выше шаги не дают

Вращение матрицы факторных нагрузок


Оказывается, что описанные выше шаги не дают однозначного

решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. (Брать после вращения)
Слайд 47

Вращение матрицы факторных нагрузок Необходимость вращения факторов возникает чаще всего, когда

Вращение матрицы факторных нагрузок


Необходимость вращения факторов возникает чаще всего, когда выявленным

факторам не удается дать достаточно четкую содержательную интерпретацию.
Слайд 48

Вращение матрицы факторных нагрузок В программе STATISTICA: Варимакс (Varimax) – это

Вращение матрицы факторных нагрузок


В программе STATISTICA:
Варимакс (Varimax) – это такое ортогональное

вращение, при котором происходит минимизация количества переменных с высокой факторной нагрузкой.
Слайд 49

Вращение матрицы факторных нагрузок Квартимакс (Quartimax) – ортогональное вращение, при котором

Вращение матрицы факторных нагрузок


Квартимакс (Quartimax) – ортогональное вращение, при котором происходит

минимизация количества факторов, необходимых для объяснения переменных.
Слайд 50

Вращение матрицы факторных нагрузок Биквартимакс (Biquartimax) –метод, который является компромиссом между

Вращение матрицы факторных нагрузок


Биквартимакс (Biquartimax) –метод, который является компромиссом между варимаксом

и квартимаксом, то есть направлен на одновременную максимизацию дисперсий и строк, и столбцов матрицы квадратов факторных нагрузок
Слайд 51

Вращение матрицы факторных нагрузок Эквамакс (Equamax) – тоже является компромиссом между

Вращение матрицы факторных нагрузок


Эквамакс (Equamax) – тоже является компромиссом между варимаксом

и квартимаксом; отличается от биквартимакса весом, который присваивается критерию варимакс.
Слайд 52

Алгоритм факторного анализа Заносим данные в программу. Выбираем метод - анализ

Алгоритм факторного анализа

Заносим данные в программу.
Выбираем метод - анализ главных компонент

или факторный анализ. Если выбран факторный анализ, то выбираем метод факторного анализа.
Слайд 53

Алгоритм факторного анализа Выбираем количество факторов. Строим матрицу факторных нагрузок. Вращаем матрицу факторных нагрузок. Интерпретируем факторы.

Алгоритм факторного анализа

Выбираем количество факторов.
Строим матрицу факторных нагрузок.
Вращаем матрицу факторных нагрузок.
Интерпретируем

факторы.    
Слайд 54

Алгоритм факторного анализа Если ничего не получается, то можно попробовать разные

Алгоритм факторного анализа

Если ничего не получается, то можно попробовать разные способы

вращения (возвращаемся на п.5).
Если это ничего не дает, то можно попробовать взять разное количество факторов (возвращаемся на п. 3)
Если и это ничего не дает, то можно попробовать взять другой метод (возвращаемся на п. 2)    
Слайд 55

Как это посчитать? Выбираем число факторов

Как это посчитать?

Выбираем число факторов

Слайд 56

Как это посчитать? Таблица собственных значений

Как это посчитать?

Таблица собственных значений

Слайд 57

Таблица собственных значений

Таблица собственных значений

Слайд 58

Как это посчитать? График каменистой осыпи

Как это посчитать?

График каменистой осыпи

Слайд 59

График каменистой осыпи

График каменистой осыпи


Слайд 60

Как это посчитать? Выбор метода вращения

Как это посчитать?

Выбор метода вращения

Слайд 61

Разбиение на группы Если факторы найдены и истолкованы, то на последнем

Разбиение на группы

Если факторы найдены и истолкованы, то на последнем шаге

ФА отдельным наблюдениям (т.е. испытуемым) можно присвоить значения этих факторов (т.н. факторные значения – factor scores).
Слайд 62

Разбиение на группы Таким образом, для каждого наблюдения значения большого количества

Разбиение на группы

Таким образом, для каждого наблюдения значения большого количества переменных

можно перевести в значения небольшого количества факторов. Факторные значения лежат, как правило, в пределах от –3 до +3 и характеризуют положение испытуемого на шкале, задаваемой фактором.
Слайд 63

Разбиение на группы

Разбиение на группы

Слайд 64

Разбиение на группы

Разбиение на группы

Слайд 65

Разбиение на группы Если факторов больше или введены дополнительные градации (плохо

Разбиение на группы

Если факторов больше или введены дополнительные градации (плохо учится

– хорошо учится – отлично учится), то групп становится намного больше.
Слайд 66

Как это посчитать? Факторные значения

Как это посчитать?

Факторные значения

Слайд 67

Факторные значения

Факторные значения

Слайд 68

Факторный анализ Наиболее плодотворно использование факторного анализа на ранних стадиях исследования

Факторный анализ

Наиболее плодотворно использование факторного анализа на ранних стадиях исследования
Факторный анализ

есть прежде всего средство проверки, отбора гипотез, а не волшебная палочка, извлекающая из груды сырых фактов «скрытые закономерности».
Слайд 69

Удачные примеры (с моей т.з.) Адаптация теста (психодиагностичекой методики) Исследование семантических пространств

Удачные примеры (с моей т.з.)

Адаптация теста (психодиагностичекой методики)
Исследование семантических пространств

Слайд 70

Удачные примеры Измерение личностных особенностей (по Иванову для взрослых) Шкалы: Кривизны

Удачные примеры

Измерение личностных особенностей (по Иванову для взрослых)
Шкалы:
Кривизны
Неприспособленности
Неудачливости
Нужды в психологической

помощи
Слайд 71

Удачные примеры Измерение личностных особенностей (по Иванову для взрослых) Шкала кривизны

Удачные примеры

Измерение личностных особенностей (по Иванову для взрослых)
Шкала кривизны
Насколько часто

Вы попадаете в неприятные положения?
Как часто над Вами смеются?

Слайд 72

Удачные примеры

Удачные примеры

Слайд 73

Удачные примеры Семантический дифференциал (например, у В.Ф. Петренко «Основы психосемантики») Баба

Удачные примеры

Семантический дифференциал
(например, у В.Ф. Петренко «Основы психосемантики»)
Баба Яга
Добрая – Злая
Красивая

– Некрасивая
Ленивая – Трудолюбивая

Слайд 74

Удачные примеры

Удачные примеры

Слайд 75

Удачные примеры

Удачные примеры

Слайд 76

Требования и ограничения ФА Нормальное распределение всех переменных Все наблюдения независимы

Требования и ограничения ФА

Нормальное распределение всех переменных
Все наблюдения независимы
По крайней

мере интервальные шкалы

Т.е. данные должны быть такими, которые подходят для подсчета к-та корреляции Пирсона

Слайд 77

Что представляем в статье? Обычно дается матрица факторных нагрузок после вращения

Что представляем в статье?

Обычно дается матрица факторных нагрузок после вращения

с указанием процента объясненной дисперсии для каждого фактора
+ ВАША ИНТЕРПРЕТАЦИЯ!
Слайд 78

Что представляем в статье?

Что представляем в статье?

Слайд 79

Что такое КМО? КМО - это показатель Кайзера и его коллег:

Что такое КМО?

КМО - это показатель Кайзера и его коллег:

Kaiser-Meyer-Olkin measure
Мера выборочной адекватности
Это % дисперсии, который объясняют общие (латентные) факторы
Должен быть > 0,5

KMO and Bartlett's Test of Sphericity –
есть в SPSS, но нет в Statistica

Слайд 80

Что такое КМО? Bartlett's Test of Sphericity – проверяет, является ли

Что такое КМО?

Bartlett's Test of Sphericity –
проверяет, является ли матрица

единичной, что будет свидетельствовать о том, что факторная модель не подходит для этого случая.
Т.е. этот тест д.б. значимым!

KMO and Bartlett's Test of Sphericity –
есть в SPSS, но нет в Statistice

Слайд 81

Полезная литература Просто и доходчиво факторный анализ изложен в Гусев А.Н.,

Полезная литература

Просто и доходчиво факторный анализ изложен в
Гусев А.Н., Измайлов

Ч.А., Михалевская М.Б. Измерение в психологии: общий психологический практикум. – М.: Смысл, 1997.
Ермолаев О.Ю. Математическая статистика для психологов: Учебник/ - 2-е изд., испр. – М.: Московский психолого-социальный институт: Флинта, 2003.
Электронный учебник по ФА (Радчикова Н., Радчиков А.)
Слайд 82

Полезная литература ПРОГРАММА STATISTICA Боровиков В. Программа STATISTICA для студентов и

Полезная литература

ПРОГРАММА STATISTICA
Боровиков В. Программа STATISTICA для студентов и инженеров. -

Компьютер Пресс: Москва, 2001.
Электронный учебник по программе (StatSoft)
ПРОГРАММА SPSS
Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. – СПб. – Речь. – 2004.
Бююль А., Цефель П. SPSS: Искусство обработки информации. – СПб, «ЛиаСофтЮп». –2001.
Слайд 83

Факторный анализ СПАСИБО ЗА ВНИМАНИЕ!

Факторный анализ

СПАСИБО
ЗА ВНИМАНИЕ!

Слайд 84

Факторный анализ Это все был только эксплораторный факторный анализ!

Факторный анализ

Это все был только эксплораторный факторный анализ!

Слайд 85

Конфирматорный ФА Основная идея: Вы сами придумываете модель (какие переменные должны

Конфирматорный ФА

Основная идея:
Вы сами придумываете модель (какие переменные должны объединяться)

и проверяете, насколько это предположение соответствует собранным данным
Слайд 86

Конфирматорный ФА В STATISTICA 6.0 Statistics – Advanced Linear/Nonlinear Models –

Конфирматорный ФА

В STATISTICA 6.0
Statistics – Advanced Linear/Nonlinear Models – Structural

Equation Modeling – Path Wizard – Confirmatory factor analysis
Слайд 87

Конфирматорный ФА

Конфирматорный ФА

Слайд 88

Конфирматорный ФА Левая сторона показывает, благополучно ли завершились итерации

Конфирматорный ФА

Левая сторона
показывает, благополучно ли завершились итерации

Слайд 89

Конфирматорный ФА Maximum Residual Cosine – показатель хорошего завершения итераций. Должен быть близок к нулю

Конфирматорный ФА

Maximum Residual Cosine – показатель хорошего завершения итераций. Должен быть

близок к нулю
Слайд 90

Конфирматорный ФА Maximum Absolute Constraint Тоже показатель хорошего завершения итераций. Должен быть близок к нулю

Конфирматорный ФА

Maximum Absolute Constraint
Тоже показатель хорошего завершения итераций. Должен быть близок

к нулю
Слайд 91

Конфирматорный ФА ICSF Criterion. и ICS Criterion. Должны быть близки к нулю

Конфирматорный ФА

ICSF Criterion.
и
ICS Criterion.
Должны быть близки к нулю

Слайд 92

Конфирматорный ФА Boundary Conditions. Должен равняться нулю. Если этот показатель не

Конфирматорный ФА

Boundary Conditions.
Должен равняться нулю.
Если этот показатель не равен нулю,

критерий хи-квадрат может давать неверную информацию
Слайд 93

Конфирматорный ФА Правая сторона показывает, соответствует ли реальность Вашей модели

Конфирматорный ФА

Правая сторона
показывает, соответствует ли реальность Вашей модели

Слайд 94

Конфирматорный ФА Chi-square Statistic Проверяет нуль-гипотезу об идеальном соответствии

Конфирматорный ФА

Chi-square Statistic
Проверяет нуль-гипотезу об идеальном соответствии

Слайд 95

Конфирматорный ФА RMS Standardized Residual Этот показатель должен быть меньше, чем

Конфирматорный ФА

RMS Standardized Residual
Этот показатель должен быть меньше, чем 0,05 для

того, чтобы считать выбранную модель «хорошей» в практическом плане
Слайд 96

Конфирматорный ФА Кроме этого, можно посмотреть еще несколько индексов:

Конфирматорный ФА

Кроме этого, можно посмотреть еще несколько индексов:

Слайд 97

Полезная литература К практическому занятию по ФА надо прочитать: Войскунский А.Е.

Полезная литература

К практическому занятию по ФА надо прочитать:
Войскунский А.Е. и др.

Мотивация хакеров: психосемантическое исследование// ПЖ, 2003, т.24, № 1, с. 104-118