Содержание
- 2. Основные понятия Классификация – разделение рассматриваемой совокупности объектов или явлений на однородные, в определенном смысле, группы
- 3. Пусть каждый i-ый из анализируемых объектов характеризуется значениями определенного набора признаков (свойств) , т.е. речь идет
- 4. Результат 1. если число классов k и их смысл известны заранее, то каждое из n классифицируемых
- 5. Если в начале располагают не только классифицируемыми данными, но и обучающими выборками, то имеем задачу классификации
- 6. Кластерный анализ Постановка задачи. Пусть исследуется совокупность n объектов, каждый из которых характеризуется по k замеренным
- 7. Расстояние между объектами и мера близости Понятие однородности объектов задается либо введением правила вычисления расстояния ρ(Xi,Xj)
- 8. x2 x1
- 9. Расстояние между объектами и мера близости обычное евклидово расстояние; xil – значение l-го признака у i-го
- 10. Расстояние между объектами и мера близости (продолжение) «взвешенное» евклидово расстояние; Каждой компоненте xl вектора X приписывают
- 11. Расстояние между объектами и мера близости (продолжение) хеммингово расстояние; Используется как мера различия объектов, задаваемых дихотомическими
- 12. Расстояние между кластерами Пусть Si – i-я группа (кластер), состоящая из ni объектов. Способы вычисления расстояния
- 13. Расстояние между кластерами расстояние по принципу «дальнего соседа»: расстояние между центрами тяжести классов где - «центр
- 14. Расстояние между кластерами расстояние по принципу «средней связи»: - среднее арифметическое всех попарных расстояний между представителями
- 15. Иерархические процедуры классификации позволяют получить представление о структуре классифицируемой совокупности наблюдений в форме дендрограммы. Различают агломеративные
- 16. Агломеративные иерархические процедуры классификации на первом шаге рассматривают каждое из классифицируемых наблюдений как отдельный кластер. Далее
- 17. Иерархические процедуры классификации ПРИМЕР По приведенным данным провести классификацию 5 семей по двум показателям: уровень расходов
- 18. Иерархические процедуры классификации x2 x1
- 19. Иерархические процедуры классификации РЕШЕНИЕ 1.1. Евклидова метрика. Принцип «ближнего соседа».
- 20. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1, S2, S3, S4,5
- 21. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Расстояние между кластерами S1 и S4,5 равно:
- 22. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,2, S3, S4,5
- 23. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Расстояние между кластерами S1,2 и S4,5 равно:
- 24. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,2,3, S4,5
- 25. Иерархические процедуры классификации
- 26. Иерархические процедуры классификации
- 27. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) 1.2. Принцип «дальнего соседа». Имеем: S1, S2, S3, S4,5
- 28. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Расстояние между кластерами S1 и S4,5 равно:
- 29. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,2, S3, S4,5
- 30. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Расстояние между кластерами S1,2 и S4,5 равно:
- 31. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,2, S3,4,5
- 32. Иерархические процедуры классификации
- 33. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) 1.3. Принцип «центра тяжести». Имеем: S1, S2, S3, S4,5
- 34. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Кластер S4,5 характеризуется центром тяжести: Расстояние между кластерами S1 и S4,5
- 35. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,2, S3, S4,5
- 36. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Кластер S1,2 характеризуется центром тяжести: Расстояние между кластерами S1,2 и S4,5
- 37. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,2,3, S4,5
- 38. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Кластер S1,2,3 характеризуется центром тяжести: Расстояние между кластерами S1,2,3 и S4,5
- 39. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) 1.4. Принцип «средней связи». Имеем: S1, S2, S3, S4,5
- 40. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Расстояние между кластерами S1 и S4,5 равно:
- 41. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,2, S3, S4,5
- 42. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Расстояние между кластерами S1,2 и S4,5 равно:
- 43. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,2,3, S4,5
- 44. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Расстояние между кластерами S1,2,3 и S4,5 равно:
- 45. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) 2.1. Взвешенное евклидово расстояние. Принцип «ближнего соседа». w1=0,05 и w2 =
- 46. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1, S2,3,S4, S5
- 47. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1, S2,3, S4,5
- 48. Иерархические процедуры классификации РЕШЕНИЕ (продолжение) Имеем: S1,,4,5, S2,3
- 49. СТЭФ-2017
- 50. Метод Метод K-средних
- 51. Метод К-средних предназначен для разбиения многомерных наблюдений на заданное число К кластеров, однородных в смысле геометрической
- 52. Метод К-средних обычно используется при достаточно больших объемах n классифицируемых данных и реализуется по следующей схеме.
- 53. Затем на j-й итерации «извлекается» точка и выясняется, к какому из эталонов она оказалась ближе всего.
- 54. Имеем нулевое приближение: , i = 1, 2, …, k После «извлечения» новой точки xk+ν пересчет
- 55. Метод K-средних
- 56. 2-й этап метода K-средних посвящен соответственно процедуре классификации. Окончательное разбиение S исследуемой совокупности на K классов
- 57. СТЭФ-2017
- 58. Метод K-средних
- 60. Скачать презентацию