Ассоциативные правила в маркетинге и медицине

Содержание

Слайд 2

“Data Mining – это процесс поддержки принятия решений, основанных на поиске

“Data Mining – это процесс поддержки принятия решений, основанных на поиске

в данных скрытых закономерностей. Это технология, которая предназначена для поиска в больших объемах данных неочевидных, но объективных и полезных на практике закономерностей”
Слайд 3

Задачи интеллектуального анализа данных Задачи ИАД Описательные Ассоциативные правила Кластеризация Классификация Прогнозирование Предсказательные

Задачи интеллектуального анализа данных

Задачи ИАД

Описательные

Ассоциативные правила

Кластеризация

Классификация

Прогнозирование

Предсказательные

Слайд 4

Ассоциативные правила Цель задачи поиска ассоциативных правил заключается в обнаружении закономерностей

Ассоциативные правила

Цель задачи поиска ассоциативных правил заключается в обнаружении закономерностей между

связанными событиями.

Product placement in Tesco, UK.

Анализ рыночных корзин
Планирование закупки и размещения товаров
Проведение акций и скидок
Проведение рекламной кампании
Создание новых видов товаров (X со вкусом Y)
Сфера услуг
Объединение сервисов X и Y в один пакет услуг
Медицина
Анализ сочетания болезней и симптомов
Выявление коморбидных заболеваний

Слайд 5

Цель метода ассоциативных правил

Цель метода ассоциативных правил

 

 

 

 

 

Слайд 6

Confidence Достоверность (Confidence) показывает, как часто в записях базы данных, содержащих

Confidence

Достоверность (Confidence) показывает, как часто в записях базы данных, содержащих X,

одновременно присутствует Y , т.е. оценивает вероятность того, что из наличия записи набора X следует наличие в ней набора Y

 

Слайд 7

Lift

Lift

 

 

Слайд 8

Сравнение Confidence и Lift на примере Конфеты и Вода обладают наибольшей

Сравнение Confidence и Lift на примере

Конфеты и Вода обладают наибольшей поддержкой,

что обеспечивает высокую достоверность правила {Конфеты => Вода}. Однако, Lift = 1 указывает на отсутствие значимых ассоциаций между этими товарами.
Правило {Конфеты => Косметика} обладает низкой достоверностью вследствие невысокой поддержки Косметики. Однако, если покупается косметика, то, вероятнее всего, с этим товаром покупают Конфеты, что подтверждает Lift = 2,0.
Слайд 9

Алгоритм Apriori 1-элементные наборы 2-элементные наборы Min support = 3% 3-элементные наборы

Алгоритм Apriori

1-элементные наборы

2-элементные наборы

Min support = 3%

 

3-элементные

наборы
Слайд 10

Уменьшение числа кандидатов Создание кандидатов – затратная операция, которая может привести

Уменьшение числа кандидатов

Создание кандидатов – затратная операция, которая может привести к

созданию множеств кандидатов, имеющих большой объем.
• Принцип Apriori: Набор из k элементов будет часто встречаться, если все его подмножества из k-1 элемента тоже были часто встречающимися
• Свойство антимонотонности поддержки: с ростом размера набора элементов поддержка уменьшается или остается такой же

 

 

 

1-элементные наборы

2-элементные наборы

Min support = 3

3-элементные наборы

Слайд 11

Построение ассоциативных правил на Python

Построение ассоциативных правил на Python

Слайд 12

Построение ассоциативных правил на Python

Построение ассоциативных правил на Python

Слайд 13

Ассоциативные правила (вывод алгоритма Apriori)

Ассоциативные правила (вывод алгоритма Apriori)

Слайд 14

Медицинский набор данных и маркёры атеросклероза ArmsIndex =1, if |ΔSBPa|=| SBPra

Медицинский набор данных и маркёры атеросклероза

ArmsIndex =1, if |ΔSBPa|=| SBPra -

SBPla |≥15; else 0

LegsIndex = 1, if |ΔSBPl|=| SBPrl - SBPll |≥15; else 0

ABI = 1, if SBPl(r)l/ SBPl(r)a≤0.9; else 0

ABI - Ankle-Brachial Index
SBP – Systolic Blood Pressure

Слайд 15

Python: обработка категориальных признаков

Python: обработка категориальных признаков

Слайд 16

Python: обработка числовых признаков

Python: обработка числовых признаков

Слайд 17

Пример набора правил Классификация правил: Полезные Тривиальные Неочевидные

Пример набора правил

Классификация правил:
Полезные
Тривиальные
Неочевидные

Слайд 18

Построение обобщенных правил

Построение обобщенных правил