Содержание
- 2. Постановка задачи Имеются два разных действия, обычно это представляется как использование ручек у двурукого игрового бандита
- 3. Пуассоновский двурукий бандит Отличается тем, что рассматривается не дискретное время, а непрерывное Распределение Пуассона описывает вероятности
- 4. Стратегия выбора действия Байесовская стратегия состоит в минимизации функции потерь на всём множестве допустимых значений параметра
- 5. Байесовская стратегия Апостериорное распределение вероятностей вычисляется при наличии предыстории Это классическая Байесовская формула Априорное распределение обычно
- 6. Байесовская стратегия Необходимо на каждом шаге выбирать действие с наименьшим Байесовским риском. Для первой ручки формула
- 8. Скачать презентацию