Метод Варда

Содержание

Слайд 2

Джо Вард Доктор Д. Вард работал в таких направлениях, как Педагогическая

Джо Вард

Доктор Д. Вард работал в таких направлениях, как
Педагогическая психология
Статистика
И

другие.
Он был консультантом ВВС, армии и флота США по применению статистических методов для подбора и оценки персонала, поступающего на службу.
Последние годы жизни он посветил волонтерской работе в начальной школе, которая названа в честь него - Dr. Joe Ward Elementary School
Слайд 3

Метод Варда Метод Варда – это альтернативный подход для проведения кластерного

Метод Варда

Метод Варда – это альтернативный подход для проведения кластерного анализа.

В основном, вместо использования метрик и мер связей данный метод большее рассматривает проблему с точки зрения дисперсионного анализа. Он подходит скорее для анализа количественных переменных, а не для бинарных переменных.
Слайд 4

Метод Варда Метод Варда – это альтернативный подход для проведения кластерного

Метод Варда

Метод Варда – это альтернативный подход для проведения кластерного анализа.

В основном, вместо использования метрик и мер связей данный метод большее рассматривает проблему с точки зрения дисперсионного анализа. Метод Вада подходит скорее для анализа количественных переменных, а не для бинарных переменных.
Слайд 5

Метод Варда Основываясь на том, что кластеры многомерных наблюдений должны иметь

Метод Варда

Основываясь на том, что кластеры многомерных наблюдений должны иметь примерно

эллиптическую форму, считается, что данные из каждого кластера будут реализованы в многомерное распределение. То есть, если построить p-мерную точечную диаграмму, кластеры будут похожи на эллипс.
Слайд 6

Метод Варда Пусть Xijk – означает значение k- переменной в j

Метод Варда

Пусть
Xijk – означает значение k- переменной в j –

наблюдении, принадлежащему i – кластеру.
При этом для реализации данного метода мы должны определить следующее:
Слайд 7

Метод Варда Ошибка суммы квадратов: Здесь суммируется все переменные во всех

Метод Варда

Ошибка суммы квадратов:

Здесь суммируется все переменные во всех подчастях каждого

кластера и сравнивается отдельное наблюдение для каждой переменной со средней этой переменной из кластера. Если ESS имеет малые значения, то данные близки к средним по кластеру, подразумевая, что мы уже имеем кластер, как единицу анализа.
Слайд 8

Метод Варда Общая сумма квадратов: В данном случае сравнивается отдельные наблюдения

Метод Варда

Общая сумма квадратов:

В данном случае сравнивается отдельные наблюдения в каждой

переменной с общей средней по переменной.
Слайд 9

Метод Варда R-квадрат: Значение интерпретируется, как доля вариации, объясняемая специфической кластеризацией наблюдений.

Метод Варда

R-квадрат:

Значение интерпретируется, как доля вариации, объясняемая специфической кластеризацией наблюдений.

Слайд 10

Метод Варда Использование метода Варда начинается с образования n кластеров, куда

Метод Варда

Использование метода Варда начинается с образования n кластеров, куда входит

по одному наблюдению. На первом шаге формируется n-1 кластер, где в одном из кластеров объединяется два наблюдения. Вычисляется ошибка сумм квадратов и r- квадрат. На следующем этапе образуется n-2 кластера, при этом в двух из кластерах может оказаться по два наблюдения, а во всех остальных по одному, или в одном кластере 3 наблюдения, а во всех остальных по одному. Таким образом на каждом шаге кластеры или наблюдения комбинируются таким образом, чтобы свести к минимуму ошибки суммы квадратов и максимизировать значение r – квадрат. Реализация алгоритма завершается, когда образуется один большой кластер, куда входят все наблюдения.