Наивный байесовский классификатор
Задача про рак груди 1% женщин в возрасте 40 лет, участвовавших в регулярных обследованиях, имеют рак груди. 80% женщин с раком груди имеют положительный результат маммографии. 9.6% здоровых женщин также получают положительный результат (маммография, как любые измерения, не дает 100% результатов). Женщина-пациент из этой возрастной группы получила положительный результат на регулярном обследовании. Какова вероятность того, что она фактически больна раком груди? Только 15%(!) врачей отвечают правильно Решение задачи про рак груди Возьмем 10 000 женщин. До маммографии женщин можно разделить на 2 группы: Группа 1: 100 женщин больных раком груди. Группа 2: 9,900 женщин не больных раком груди. После маммографии женщин можно разделить на 4 группы: Группа A: 80 женщин больных раком груди, и с положительной маммограммой. Группа B: 20 женщин больных раком груди, и с отрицательной маммограммой. Группа C: 950 женщин не больных раком груди, и с положительной маммограммой. Группа D: 8,950 женщин не больных раком груди, и с отрицательной маммограммой. Группа A: 80 женщин больных раком груди, и с положительной маммограммой. Группа C: 950 женщин не больных раком груди, и с положительной маммограммой. Вероятность того, что женщина с положительной маммограммой фактически больна раком груди: Доля (A) в (A + C) 80 / (80 + 950) = 80 / 1030 = 7.8%.