Содержание
- 2. Основные приложения Dimensionality reduction Снижение размерности данных при сохранении всей или большей части информации Feature extraction
- 3. Анализ заемщиков банка Задача : Проанализировать заемщиков банка на основе различных данных
- 4. Личные данные Семейное положение Образование Финансовое состояние Имущество Кредитная история … Данные могут быть:
- 5. Пример: Give Me Some Credit* * https://www.kaggle.com/c/GiveMeSomeCredit
- 6. Признаки Возобновляемое использование необеспеченных линий Возраст Количество просроченных дней 30-59 Коэффициент задолженности Ежемесячный доход Количество открытых
- 7. Пример: Give Me Some Credit* * https://www.kaggle.com/c/GiveMeSomeCredit
- 8. Задача снижения размерности Представить набор данных меньшим числом признаков таким образом, чтобы потеря информации, содержащейся в
- 9. Principal Component Analysis (PCA) Данные заданы матрицей размерности n×m, где и , n – число наблюдений
- 10. PCA в SAS Studio
- 11. PCA в SAS Studio
- 12. Principal Component Analysis Обозначим за C (m×m) матрицу ковариаций признаков матрицы X: В матричном виде:
- 13. Principal Component Analysis Вариация i-го признака: Общая вариация данных: Задача: найти ортогональные векторы такие, что т.е.
- 14. Матрица C симметричная и положительно определена. Имеет место равенство: Principal Component Analysis
- 15. Principal Component Analysis Главные компоненты: Доля объясненной вариации:
- 16. Доля объясненной вариации
- 17. Доля объясненной вариации
- 18. Интерпретация главных факторов
- 19. Интерпретация главных факторов Исходя из структуры матрицы факторных нагрузок, можно предложить следующую интерпретацию: U1: История просроченных
- 20. Интерпретация главных факторов
- 21. Singular value decomposition Данные заданы матрицей размерности n×m, где и , n – число наблюдений (объектов),
- 22. Выбор числа k главных факторов Общая дисперсия данных: Доля объясненной дисперсии: Хорошим значением считается доля объясненной
- 23. Задания Воспроизведите программный код, представленный в файле Сем 3_PCA.doc Воспроизведите вычисления, представленные в лекционных материалах для
- 24. PCA в SAS Studio (задание 1)
- 25. PCA в SAS Studio
- 26. PCA в SAS Studio
- 27. PCA в SAS Studio
- 29. Скачать презентацию