Содержание
- 2. Бизнес-задача Задача – отличить фальшивые банкноты от настоящих База Banknote authentification: https://archive.ics.uci.edu/ml/datasets/banknote+authentication Объекты представляют из себя
- 3. Бизнес-задача Способ решения – классификация Метод классификации – SVM (Support Vector Machine) Положительные стороны SVM: быстрый
- 4. Метод Support Vector Machine Изобретён в 1963 году, авторы – Вапник, Червоненкис Современная постановка в 1995
- 6. Математическая постановка Пусть даны два линейно разделимых класса объектов Мы можем описать все точки разделяющей гиперплоскости
- 8. Математическая постановка Можно найти ширину данной полосы как Для машины опорных векторов необходимо найти разделяющую гиперплоскость,
- 9. Решение оптимизационной задачи Метод множителей Лагранжа: Производные: Двойственная проблема:
- 10. Для неразделимых классов вводится функция потерь Задача оптимизации: Данная форма SVM называется C-classification. Случай линейно неразделимой
- 11. Метод множителей Лагранжа: Производные: Двойственная проблема: Случай линейно неразделимой выборки
- 12. Предсказание Для предсказания результата алгоритма, используется функция sign: Для λi=0 точка xi не является «опорной», таким
- 13. Использование метода SVM Использован набор данных Banknote Authentification В качестве тестовой выборки взяты 107 последних объектов
- 14. Обучение модели, Intel DAAL
- 15. Предсказание, Intel DAAL
- 16. Предсказание, Intel DAAL
- 17. Алгоритм SVM, Python, R
- 18. Результаты вычислений для данных Banknote Authentification Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с
- 19. Ядра (Kernel Trick) Ядро – функция специального вида: Симметричная Неотрицательно определенная Ядро используется вместо линейного скалярного
- 20. Kernel Trick Функция ядра переводит точки в пространство большей размерности. Пример:
- 21. Пример использования ядра
- 22. Виды ядер
- 23. Предсказание Для предсказания результата алгоритма, используется функция sign: Для λi=0 точка xi не является «опорной», таким
- 24. Результаты вычислений для данных Banknote Authentification Результаты вычислений (суммарное время получения модели + предсказание, количество ошибок):
- 25. Результаты вычислений для данных Banknote Authentification Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с
- 26. Результаты вычислений для данных Banknote Authentification Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с
- 27. Набор данных Adult Income* *https://archive.ics.uci.edu/ml/datasets/Adult Набор данных Adult Income содержит объекты, каждый объект – социальные характеристики
- 28. Признаки
- 29. Набор данных Adult Income* В обучающей выборке содержатся 30162 объекта (22653 объекта класса Случайный классификатор даёт
- 30. Результаты вычислений для данных Adult Income Результаты вычислений: DAAL: ~400 секунд, точность 0.63 (линейное ядро, после
- 31. Результаты вычислений для данных Adult Income
- 32. Плюсы и минусы SVM Плюсы: это наиболее быстрый метод нахождения решающих функций; метод сводится к решению
- 33. Практическое задание Проанализировать разные результаты для набора данных Banknote Authentification, в чём разница базовых настроек алгоритма
- 34. Ссылки на реализации алгоритма http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf - LIBSVM: A Library for Support Vector Machines, Chih-Chung Chang and
- 36. Скачать презентацию