Средства Data Mining в Matlab

Содержание

Слайд 2

MATLAB MATLAB— пакет прикладных программ для решения задач технических вычислений и

MATLAB

MATLAB— пакет прикладных программ для решения задач технических вычислений и одноимённый

язык программирования, используемый в этом пакете. Пакет используют более миллиона инженерных и научных работников, он работает на большинстве современных операционных систем.
Слайд 3

История создания Конец 1970-х годов, Университет Нью- Мексико, Клив Моулер 1983

История создания

Конец 1970-х годов, Университет Нью- Мексико, Клив Моулер
1983 год, Стэнфордский

университе, Джон Литтл
1984 год, “The MathWorks”
Слайд 4

Ключевые особенности (1) Платформонезависимый высокоуровневый язык программирования ориентированный на матричные вычисления

Ключевые особенности (1)

Платформонезависимый высокоуровневый язык программирования ориентированный на матричные вычисления и

разработку алгоритмов
Интерактивная среда для разработки кода, управления файлами и данными
Функции линейной алгебры, статистики, анализ Фурье, решение дифференциальных уравнений и др.
Слайд 5

Ключевые особенности (2) Богатые средства визуализации, 2-D и 3-D графика Встроенные

Ключевые особенности (2)

Богатые средства визуализации, 2-D и 3-D графика
Встроенные средства разработки

пользовательского интерфейса для создания законченных приложений на MATLAB
Слайд 6

Математические пакеты для решения статистических задач

Математические пакеты для решения статистических задач

Слайд 7

Постановка задачи В настоящей работе проводится исследование исходного набора характеристик в

Постановка задачи

В настоящей работе проводится исследование исходного набора характеристик в ключе

его влияния на значение «attrition» с целью построения наиболее эффективного классификатора для прогнозирования снижения трудоспособности сотрудников.
Слайд 8

Ход работы Этап 1 Подготовка исходных данных Этап 2 Анализ описательных статистик Этап 3 Классификация

Ход работы

Этап 1 Подготовка исходных данных
Этап 2 Анализ описательных статистик
Этап

3 Классификация
Слайд 9

Этап 1

Этап 1

Слайд 10

Этап 2 Результаты корреляционного анализа

Этап 2

Результаты корреляционного анализа

Слайд 11

Этап 3 Метод опорных векторов; Метод K-ближайших соседей; Метод на основе деревьев решений; Логистическая регрессия.

Этап 3

Метод опорных векторов;
Метод K-ближайших соседей;
Метод на основе деревьев решений;
Логистическая регрессия.

Слайд 12

Результаты классификации

Результаты классификации

Слайд 13

Проведенный анализ показал избыточность и частичную взаимную корреляцию исходных данных. Был

Проведенный анализ показал избыточность и частичную взаимную корреляцию исходных данных. Был

сформирован новый набор характеристик, позволяющий осуществлять прогнозирование изменения значения attrition путем решения задачи классификации с точностью 88,2 %. Полученное решение позволяет с высокой степенью вероятности прогнозировать изменения работоспособности сотрудников фирмы.