Содержание
- 2. Методы многомерного анализа (multivariate analyses) Предназначены для анализа многомерных данных Много независимых переменных – Многофакторная ANOVA
- 3. multivariate analyses Многомерное распределение Многомерные методы в большой степени описательны, но если предполагается тестирование гипотез, надо
- 4. multivariate analyses Используют особые таблицы - матрицы. Одна матрица у нас уже есть – матрица исходных
- 5. multivariate analyses Матрица (p x p) с суммами квадратов на диагонали (sums-of-squares-and-cross-products, SSCP) Матрица дисперсий и
- 6. multivariate analyses Матрица корреляций (correlation matrix, R) – получится, если в предыдущей матрице каждый элемент поделить
- 7. multivariate analyses Фундаментальная процедура в многомерном анализе – получение линейных комбинаций исходных переменных, так, что общая
- 8. multivariate analyses Новые переменные формируют так, чтобы первая объясняла максимум изменчивости исходных переменных, вторая – максимум
- 9. multivariate analyses Выделим новые компоненты для переходов: В примере используется матрица ковариаций Значения собственных значений для
- 10. multivariate analyses Теперь можно для каждого конкретного перехода посчитать значения новых переменных = компонент. И, например,
- 11. multivariate analyses Матрица «дистанций» меду объектами (dissimilarity matrix):
- 12. multivariate analyses Есть много показателей «дистанции» между объектами (самый очевидный – евклидовы расстояния). Дистанции можно посчитать
- 13. multivariate analyses Подготовка данных для многомерного анализа Трансформация данных: нормализует распределения и делает отношения между переменными
- 14. multivariate analyses Лица Чернова «звёздный» график – star plot
- 15. ФАКТОРНЫЙ АНАЛИЗ У нас в руках измерения большого числа переменных для выборки объектов. Наши цели: Уменьшить
- 16. Анализ главных компонент (principal component analysis, PCA) Factor analysis У нас есть n объектов и p
- 17. Factor analysis Этап 0. Подготовка данных к анализу. Проверка распределений на соответствие нормальному; Трансформация данных (напр.,
- 18. Factor analysis Этап 3. получение factor loadings Это показатели корреляции (Пирсона) компонент с каждой из исходных
- 19. Factor analysis Несколько слов о компонентах (факторах): В многомерном пространстве первая компонента располагается вдоль наибольшей дисперсии,
- 20. Вращение компонент (факторов) Factor analysis Выбранные нами факторы (их мало) поворачивают для получения более чёткой структуры
- 21. Мы изучаем пищевые предпочтения павианов и разработали комплексные оценки привлекательности разных типов пищи для каждой особи.
- 22. Итак, Мы хотим Найти те факторы, которые определяют изменчивость (объясняют действие) большого количества измеренных нами реальных
- 23. Поясняющий пример: Мы изучаем кроликов. Сначала взвешиваем каждого из 100 кроликов на безмене, потом на весах
- 24. Подразумевается, что наши реально измеренные переменные являются линейными комбинациями этих подлежащих факторов. Примерно так будет проходить
- 25. Итак, мы изучаем питание павианов. Типов пищи у павианов 10: апельсины, бананы, яблоки, помидоры, огурцы, мясо,
- 26. Principal component analysis (прежде, чем проводить факторный анализ, рекомендуется построить матрицу корреляций: исключить переменные, слишком сильно
- 27. Просмотрим матрицу корреляций: Не должно быть слишком сильно коррелирующих друг с другом переменных (иначе матрица не
- 28. Собственные значения (eigenvalues)– определяют, какую долю общей дисперсии объясняет данный фактор.
- 29. Этот график показывает, что первые два фактора лучше остальных, они объясняют большую часть общей изменчивости (the
- 30. Посмотрим, как полученные факторы связаны с реальными переменными
- 31. оставим две компоненты и проведём вращение, чтобы улучшить их структуру.
- 32. Фактор 1 в основном связан с растительной пищей, фактор 2 – с животной. После вращения факторов
- 33. Посмотрим, как исходные переменные расположились в пространстве новых факторов
- 34. Если мы в дальнейшем хотим проводить анализ связи питания павианов с другими переменными, мы можем заменить
- 35. Требования к выборкам для проведения факторного анализа Внутри групп должно быть многомерное нормальное распределение (оценка –
- 36. Связь с MANOVA и регрессионным анализом. Factor analysis Если мы на самом деле хотим сравнить группы
- 37. Principal factor analysis – если PCA генерирует компоненты, объясняющие изменчивость исходных переменных, то PFA генерирует common
- 38. Redundancy analysis – усложнённая версия Canonical correlation analysis, предсказывает линейную комбинацию зависимых переменных из комбинации независимых.
- 40. Скачать презентацию