Содержание
- 2. Знания как основной ресурс менеджмента Управление знаниями (Knowledge Management, KM) – новая и быстро развивающаяся область
- 3. Если раньше стоимость компаний составляли финансовый капитал, здания, оборудование и другие материальные ценности, то в новой,
- 4. Управление знаниями предполагает широкое использование следующих информационных технологий: баз данных и хранилищ данных (Data Warehousing –
- 5. Системы поддержки принятия решений В 1980-е годы американские и японские компании начали развивать новые информационные системы.
- 6. Современная компания с разветвленным бизнесом, как правило, имеет: системы поддержки деятельности руководителя (Executive Support Systems -
- 7. Задачи СППР Анализ обстановки (ситуаций). Генерация возможных управленческих решений (сценарий действия). Оценка сгенерированных сценариев (действий, решений)
- 8. Основные компоненты системы поддержки принятия решения
- 9. Примеры социальных и экономических проблем, требующих анализа данных
- 10. 1. Опросы населения Мониторинг общественного мнения и анализ социально-экономической ситуации. Анализ данных нужен для выяснения ситуации
- 11. 2. Общественная безопасность Анализ преступности. Анализ данных необходим для того, чтобы понять, какие типы преступлений совершаются,
- 12. 3. Образование Планирование школьных округов. Нахождение оптимального месторасположения новых школ, в зависимости от условий района, демографической
- 13. 4. Трудоустройство Анализ рынка труда - состав и структура рабочей силы. Анализ предложений работодателей. Анализ заявлений
- 14. 5. Анализ прибыли Оценка соответствия размеров уплаченных налогов и размеров собственности. Анализ мошенничеств - выявление характеристик
- 15. 6. Здравоохранение Анализ заболеваемости населения (по самым различным факторам). Эпидемиология - выявление причин заболеваний и территорий
- 16. 7. Стратегическое планирование Анализ удовлетворенности клиентов и изучение изменений потребностей общественности. Профилирование населения. Создание более эффективных
- 17. 8. Контроль качества продукции Одна из наиболее важных прикладных областей принятия решений, приносящих наибольший доход в
- 18. 9. Бизнес Без современных методов анализа невозможно осуществить обработку огромного количества данных и принятие решений, которые
- 19. 9. Бизнес (продолжение) Предсказание рыночных временных рядов. В этой области предсказания наиболее тесно связаны с доходностью,
- 20. Современные методы добычи знаний: «Оперативная аналитическая обработка данных» (On-Line Analytical Processing или (OLAP)) и «Обнаружение знаний
- 21. Хранилища данных Основой для принятия решений является анализ данных, выявление скрытых закономерностей и знаний, содержащихся в
- 22. Зачем строить хранилища данных - ведь они содержат заведомо избыточную информацию, которая и так есть в
- 23. Технология OLAP – это инструмент оперативного анализа данных, содержащихся в хранилище. Главной особенностью является то, что
- 24. Обнаружение знаний в базах данных (Knowledge discovery in databases (KDD) или Data Mining – «раскопка» данных)
- 25. Основные направления углубленного анализа данных (KDD) Можно выделить пять основных типов задач анализа данных, для решения
- 26. Интеллектуальные системы компьютерного анализа данных могут основываться на двух подходах: Первый заключается в том, что в
- 27. Экспертные системы Экспертная система — это программа для компьютера, которая оперирует со знаниями в определенной предметной
- 28. Проблемы ставятся перед системой в виде совокупности фактов, описывающих некоторую ситуацию, и система с помощью базы
- 29. Более перспективен второй подход, который основан на анализе данных с помощью статистических пакетов или нейронных сетей.
- 30. Поиск ассоциативных правил Ассоциативные правила позволяют находить закономерности между связанными событиями. Примером такого правила, служит утверждение,
- 31. Ассоциативным правилом называется правило «если X, то Y» Другими словами, целью анализа является установление следующих зависимостей:
- 32. Транзакцией называется некоторая последовательность действий, представляющих единое целое, например покупка человеком товаров в магазине. Поддержкой ассоциативного
- 33. Задача нахождения ассоциативных правил разбивается на две подзадачи: Нахождение всех наборов элементов, которые удовлетворяют некоторому заданному
- 36. Классификация данных и извлечение правил из данных. «Дерево решений» как пример экспертной системы «Дерево решений» (Decision
- 37. У каждого клиента 6 параметров (переменных) Зависимая (целевая) переменная – кредитный рейтинг. Два возможных значения: 0
- 38. Эти данные – результат исследований, направленных на выяснение характеристик клиентов, позволяющих выяснить, какие из них позволяют
- 39. Пояснения после решения примера Что получено: Набор правил, позволяющий на основе знания объясняющих переменных предсказать результативную
- 40. Можно сохранить обученное дерево решений и применять сохранённый алгоритм для предсказания кредитного рейтинга клиента. Очевидно, что
- 41. Дискриминантный анализ Дискриминантный анализ включает в себя методы классификации наблюдений в ситуации, когда исследователь обладает достаточно
- 42. Метод может применяться во всех случаях, когда на основании уже имеющейся информации, требуется отнести новый случай
- 43. Графическая интерпретация Принципы дискриминантного анализа можно пояснить графически для простого случая, когда объекты надо распределить на
- 44. Далее вычисляются координаты центров этих множеств (координаты центроидов групп – по терминологии дискриминантного анализа). На рисунке
- 45. Через центроиды проводится прямая (синяя), а через точку, находящуюся на равном расстоянии от центроидов, проводится линия
- 46. Таким образом, обучающая выборка позволяет построить новую систему координат (синяя и фиолетовая линии), которая и позволяет
- 47. У каждого клиента 6 параметров (переменных) Зависимая (целевая) переменная – кредитный рейтинг. Два возможных значения: 0
- 48. Снова все данные разобьём на обучающую выборку (70%) и тестовую (30%) с помощью введения дополнительной переменной,
- 50. Пояснения после решения примера Основные результаты – в таблице Результаты классификации Алгоритм дискриминантного анализа может исключать
- 51. SPSS и PASW PASW (Predictive Analytics Software) это «бывшая» SPSS (Statistical Package for Social Science) (после
- 52. Манипуляция данными, импорт, экспорт файлов с сохранением в различных форматах. Получение описательной статистики (среднее, дисперсия и
- 53. Как представлять данные для анализа? (типы статистических шкал в PASW) Практически все известные пакеты анализа данных
- 54. Номинативная (категориальная) шкала является самым «низким» уровнем измерения. В этом случае числовое значение приписывается переменным произвольно.
- 55. Ясно, что переменные, измеренные в этой шкале, нельзя подвергать никаким арифметическим, алгебраическим или логическим операциям. Для
- 56. Порядковая шкала применяется, если переменная выражает степень проявления какого либо свойства, и ее значения могут быть
- 57. Интервальная шкала предполагает, что можно определить не только порядок значений, но и расстояние между значениями. Эта
- 58. Шкала отношений. Для переменных, измеренных в этой шкале, определены все арифметические и логические операции, которые можно
- 59. Кластерный анализ
- 60. Кластерный анализ ставит перед собой задачу классификации объектов. Синонимами термина «кластерный анализ» являются «автоматическая классификация объектов
- 61. Кластерный анализ рационально использовать на ранних стадиях исследования, когда о данных мало что известно. Методы автоматического
- 62. Виды кластерного анализа (реализованы в PASW) Метод К- средних (или итерационный метод). Метод используется при достаточно
- 63. Пусть, например, необходимо выделить К кластеров. На первом шаге вычисляются (или задаются пользователем) координаты К центров
- 65. Анализ результатов примера Оказалось, что около 80% «плохих» заемщиков попали в один кластер, что позволяет для
- 66. Иерархический кластерный анализ. Метод используется при сравнительно небольшом числе объектов (до нескольких сотен). Сущность метода состоит
- 67. Простой пример для иллюстрации алгоритма иерархического кластерного анализа Пусть имеется четыре объекта, для которых рассчитана матрица
- 68. На последнем шаге в кластер будет включен четвертый объект, имеющий наименьшее расстояние до первого объекта, включенного
- 69. Алгоритм иерархического кластерного анализа, реализованный в PASW, очень похож на описанный выше. Шкала расстояний при построении
- 70. Факторный анализ
- 71. Факторный анализ это процедура, с помощью которой большое число переменных, характеризующих имеющиеся наблюдения, сводится к меньшему
- 72. Алгоритм факторного анализа несложен, но описывается громоздкими математическими выражениями, поэтому ограничимся простейшим примером, допускающим графическую интерпретацию.
- 73. Видно, что есть определённая закономерность в расположении точек (между ценой автомобиля и ресурсом его двигателя есть
- 74. Отыскание такой новой системы координат и нахождение взаимосвязи «новых» координат f1 f2 (называемых факторами) и «старых»
- 75. Простой пример (не следует рассматривать всерьез в содержательном аспекте) Пятью респондентами, желающими приобрести путёвки на курорт,
- 76. Вопрос: нельзя ли передать смысл ответов респондентов меньшим числом переменных? (Не четырьмя, а тремя, двумя или,
- 77. Регрессионный анализ и прогнозирование
- 78. Задачей регрессионного анализа является построение математической модели взаимосвязи явлений на основе имеющихся данных об этих явлениях.
- 79. Регрессионные модели – это модели взаимосвязи, сформулированные в виде функциональной зависимости результативной (зависимой) переменной от одной
- 81. Будем считать вес – результативной переменной, а рост – факторной Если данные о росте и весе
- 82. На первом шаге регрессионного анализа исследователь должен выбрать вид зависимости между факторным и результативным признаками. Вид
- 83. После выбора вида зависимости можно начать регрессионный анализ. Первое, что должен сделать регрессионный анализ – это
- 84. Математически критерий «максимальной близости» прямой к наблюдаемым значениям yi , - это минимальность значения суммы квадратов
- 85. Основные результаты регрессионного анализа рассмотренного примера:
- 86. Расчеты статистической значимости в регрессионном анализе базируются на обычных статистических процедурах «проверки гипотез». Выдвигается «нулевая гипотеза»
- 87. Добавим в рассматриваемый пример еще одну переменную предиктор – возраст. Это соответствует предположению, что на вес
- 88. Можно сделать вывод о том, что по наблюдаемым данным вес не зависит от возраста (константа b2
- 89. Логистическая регрессия Эта разновидность регрессионного анализа применяется не для изучения взаимосвязи явлений, а для решения задач
- 90. Рассмотрим наиболее простой случай – случай бинарной логистической регрессии. В этом случае зависимая переменная y может
- 92. Выявление взаимосвязи явлений Корреляционный анализ
- 93. В задачах корреляционного анализа требуется установить наличие взаимосвязи между изучаемыми явлениями (вычислить коэффициент корреляции и оценить
- 94. Пример вычисления коэффициента корреляции по Пирсону Данные о «параметрах» футболистов сборной России по футболу «образца» 2008
- 95. Таблицы сопряжённости и критерий χ2 Таблицы сопряженности (или «перекрестные распределения») служат для выявления зависимости между двумя
- 96. Всего 2008 человек опрошено в Украине и 1600 в России. Вопрос: есть ли взаимосвязь между мнением
- 97. В «переводе» на язык статистики задача выглядит так: есть две переменные: первая переменная – это «страна»
- 98. Если бы числа ответов респондентов были бы равны ожидаемым частотам – это означало бы, что мнения
- 99. Построение экспертных систем на основе нейронных сетей
- 100. Задачи анализа данных, решаемые с помощью нейронных сетей Выявление взаимосвязей и прогнозирование Классификация Кластеризация Классификация и
- 101. Нейронные сети как средство анализа данных Под нейронными сетями понимаются вычислительные структуры, которые моделируют процессы хранения
- 102. Элементарным преобразователем данных в нейронных сетях является нейрон, названный так по аналогии с биологическим прототипом, который,
- 103. Схема «биологического» нейрона
- 104. Схема формального нейрона
- 105. Если на входе сигналы: x1, x2… xn, то на выходе из ядра возникает итоговый сигнал S
- 106. Классификация нейронных сетей В многослойных или слоистых нейронных сетях нейроны объединяются в слои. Слой содержит совокупность
- 107. Слои в нейронных сетях
- 108. «Обучение» нейронной сети. Алгоритм обратного распространения ошибок В классическом алгоритме обучения (алгоритм обратного распространения ошибки) в
- 109. В классическом алгоритме подстройка весов синапсов происходит после предъявления нейронной сети каждого примера Более быстрые алгоритмы
- 110. Для того чтобы сеть могла анализировать данные, она должна иметь достаточный уровень сложности. Для приближенной оценки
- 111. Такое приближенное определение числа нейронов еще не гарантирует хорошие прогностические качества нейронной сети. Решением проблемы служит
- 112. Пример задачи прогнозирования Есть данные о средних за текущую неделю характеристиках фондового рынка: х1 – доходность
- 114. Скачать презентацию