Кластерный анализ. Часть 2

Содержание

Слайд 2

Слайд 3

Метод одиночной связи

Метод одиночной связи

Слайд 4

Метод одиночной связи

Метод одиночной связи

Слайд 5

Метод одиночной связи 7 4 3

Метод одиночной связи

7

4

3

Слайд 6

Метрики Евклида Т 1 = 10.0 оС Т 2 = 20.0

Метрики

Евклида

Т 1 = 10.0 оС

Т 2 = 20.0 оС

S 1 =

34.5 о/oo

S 2 = 35.5 о/oo

d2 = (Т1-Т2)2 + (S1-S2)2 = 100 + 1 =101

Стандартизация !

t i = (xi – xsr)/СКО

t(Т 1) = (10.0-15.0) оС/5 оС = -1.0

t(Т 2) = (20.0-15.0) оС/5 оС = 1.0

t(S 1) = (34.5-35.0) о/oo / 0.5 о/oo = -1.0

t(S 2) = (35.5-35.0) о/oo / 0.5 о/oo = 1.0

d2 = (t(Т1)-t(Т2))2 + (t(S1)-t(S2))2 = 4 + 4 = 8

Слайд 7

Матрица расстояний

Матрица расстояний

Слайд 8

Метрики R = 0.95 R = 0.01 R = - 0.95

Метрики

R = 0.95

R = 0.01

R = - 0.95

d

= 0.05

d = 0.99

d = 1.95

Слайд 9

Матрица расстояний Матрица корреляций

Матрица расстояний

Матрица корреляций

Слайд 10

Метрики Евклида - классификация по величине (значения переменных в одном классе

Метрики

Евклида - классификация по величине
(значения переменных в одном классе
больше или

меньше, чем в другом классе?)

1-R - классификация по изменчивости
(одинаково или по-разному
ведут себя переменные в разных классах)

Слайд 11

Методы Иерархические (одиночной связи, Уорда и др.) Используют разные виды метрик

Методы

Иерархические (одиночной связи, Уорда и др.)
Используют разные виды метрик

Итеративные (k –

средних, поиска сгущений)
Используется только Евклидова метрика
Слайд 12

Иерархический метод Уорда 2 кл 3 кл 4 кл 5 кл

Иерархический метод Уорда

2 кл

3 кл

4 кл

5 кл

min

+ просто рассчитывается
+ дает компактные

группы
+ любые метрики
- требует большого количества памяти
- не определяется количество классов
Слайд 13

Иерархический метод Уорда Выбор количества классов? 1. Исходя из задач исследования

Иерархический метод Уорда

Выбор количества классов?

1. Исходя из задач исследования

2. На

основании сравнения классов

Метрика Евклида:
сравнение средних значений переменных

Метрика 1-R:
корреляция между классами

Слайд 14

Итеративный метод k-средних - требует времени для расчета - количество классов

Итеративный метод k-средних

- требует времени для расчета
- количество классов нужно задавать

заранее
- только метрика Евклида

+ не требует памяти для матрицы расстояний
+ рассчитываются функционалы качества

3 класса

Слайд 15

Итеративный метод k-средних Функционалы качества D MK – МежКлассовое расстояние D ВК – ВнутриКлассовое расстояние

Итеративный метод k-средних

Функционалы качества

D MK – МежКлассовое расстояние

D ВК – ВнутриКлассовое

расстояние