Содержание
- 2. Последовательность работы Сбор и систематизация данных Построение модели, объясняющей имеющиеся факты Тестирование модели и интерпретация результатов
- 3. Способы анализа данных Главным лицом в процессе анализа данных является эксперт – специалист в предметной области.
- 4. Общая схема анализа Эксперт (специалист в предметной области) Гипотеза (предположение) Извлечение и визуализация: OLAP, таблицы, диаграммы,
- 5. Визуализация данных В случае визуализации эксперт формулирует некоторым образом запрос к системе, извлекает нужную информацию из
- 6. Достоинства и недостатки визуализации Достоинства: Простота создания Работа на данных малого объема и низкого качества Возможность
- 7. Построение моделей Построение моделей является универсальным способом изучения окружающего мира. Этот способ позволяет обнаруживать зависимости, прогнозировать,
- 8. Методика извлечения знаний Несмотря на большое количество разнообразных бизнес-задач почти все они решаются по единой методике.
- 9. Knowledge Discovery in Databases Источники данных Исходные данные Очищенные данные Трансформированные данные Модели (шаблоны) Знания Выборка
- 10. KDD – выборка данных Первым шагом в анализе является получение исходной выборки. На основе этих данных
- 11. KDD – очистка данных Реальные данные для анализа редко бывают хорошего качества. Необходимость предварительной обработки при
- 12. KDD – трансформация данных Трансформация данных – последний этап перед, собственно, анализом. Различные алгоритмы анализа требуют
- 13. KDD – Data Mining Data Mining – это процесс обнаружения в «сырых» данных, ранее неизвестных и
- 14. Data Mining – задачи Задачи, решаемые методами Data Mining: Классификация – это отнесение объектов к одному
- 15. Data Mining – алгоритмы Для решения вышеописанных задач используются различные методы и алгоритмы Data Mining. Ввиду
- 16. KDD – интерпретация В случае, когда извлеченные знания непрозрачны для пользователя, должны существовать методы постобработки, позволяющие
- 17. Достоинства и недостатки моделей Достоинства: Возможность тиражирования знаний Обработка огромных объемов данных Обнаружение нетривиальных закономерностей Формализация
- 18. Аналитическая система Наиболее оптимальной с точки зрения гибкости, возможностей и простоты использования является аналитическая система состоящая
- 19. Схема аналитической системы Хранилище данных Учетные системы Документы СУБД Интернет Извлечение данных Визуализация: Регулярная отчетность, нерегламентированные
- 20. Решаемые бизнес-задачи Подавляющее большинство бизнес-задач сводится к комбинированию описанных методов. Фактически, ранее были описаны базовые блоки,
- 21. Реализация в Deductor Аналитическая платформа Deductor создавалась как система, реализующая описанную выше схему анализа. Она включает
- 23. Скачать презентацию