Информационные хранилища

Содержание

Слайд 2

Системы операционной обработки способны выполнять тривиальный анализ данных – вычислять максимальные,

Системы операционной обработки способны выполнять
тривиальный анализ данных – вычислять максимальные,


минимальные и средние значения атрибутов.

Хранилища данных

Слайд 3

Система поддержки принятия решений Под системой поддержки принятия решений понимают вычислительный

Система поддержки принятия решений

Под системой поддержки принятия решений понимают
вычислительный комплекс,

ориентированный на анализ
данных и обеспечивающий получение информации,
необходимой для разработки решений в сфере управления.
Слайд 4

К числу задач, которые традиционно решают системы поддержки принятия решений, относятся:

К числу задач, которые традиционно решают системы
поддержки принятия решений, относятся:


оценка альтернатив решений,
прогнозирование,
классификация,
кластеризация,
выявления ассоциаций
и др.

Система поддержки принятия решений

Слайд 5

Для того, чтобы извлекать полезную информацию из данных, они должны быть

Для того, чтобы извлекать полезную информацию из данных,
они должны быть

организованы особым, отличным от
принятого в OLTP-системах образом.

Система поддержки принятия решений

Слайд 6

Система поддержки принятия решений Во-первых, для выполнения аналитических запросов необходима обработка

Система поддержки принятия решений

Во-первых, для выполнения аналитических запросов необходима обработка больших

информационных массивов.
Во-вторых, выполнение некоторых аналитических запросов, например, анализ тенденций и прогнозирование, требует технологической упорядоченности данных.
В-третьих, данные, используемые для целей анализа, как правило, отличаются от данных операционных систем.
Слайд 7

Хранилища данных Концепция хранилищ данных – это концепция подготовки данных для

Хранилища данных

Концепция хранилищ данных –
это концепция подготовки данных для последующего


анализа.
Она предполагает выполнение следующих положений
Слайд 8

Хранилища данных Интеграция и согласование данных из различных источников: традиционных систем

Хранилища данных

Интеграция и согласование данных из различных источников: традиционных систем операционной

обработки, информационной обработки, информации из внутренних и внешних по отношению к организации электронных архивов.
Разделение наборов данных, используемых системами выполнения транзакций и системами поддержки принятия решений.
Слайд 9

Хранилища данных Хранилище данных «предметно-ориентированный, интегрированный, неизменяемый и поддерживающий хронологию набор

Хранилища данных

Хранилище данных
«предметно-ориентированный, интегрированный,
неизменяемый и поддерживающий хронологию набор данных,

предназначенный для обеспечений принятия управленческих
решений.»
Слайд 10

Хранилища данных Исходные данные для анализа производятся системами операционной обработки, поступают

Хранилища данных

Исходные данные для анализа производятся системами операционной обработки, поступают из

электронных архивов и от поставщиков информации, например, онлайновых информационных агентств.
Эти источники слабо связаны между собой , поэтому и данные, которые они предоставляют, имеют различную структуру и форматы представления.
Слайд 11

Хранилища данных Необходимо произвести согласование данных разных источников, чтобы ими было

Хранилища данных

Необходимо произвести согласование данных разных источников, чтобы ими было удобно

оперировать при анализе.
Это подразумевает приведение их к единому формату, а также устранение дублирующихся и некорректных значений.
Слайд 12

Хранилища данных Подготовленные данные загружаются в хранилище. Пользователи-аналитики осуществляют доступ к

Хранилища данных

Подготовленные данные загружаются в хранилище.
Пользователи-аналитики осуществляют доступ к нему через

клиентские приложения.
В отличии от систем операционной обработки в СППР, использующих концепцию ХД, критерии поиска и состав выдаваемой в виде отчета информации не фиксируются при ее разработке, пользователи оперируют в основном заранее не регламентированными запросами (ad-hoc query)
Слайд 13

Концепция хранилища данных OLTP: Есть ли свободные места в купе поезда

Концепция хранилища данных

OLTP: Есть ли свободные места в купе поезда Москва

— Сочи, отправляющегося 20 августа в 23:15?
OLAP: Каким будет объем продаж железнодорожных билетов в денежном выражении в следующих трех месяцах с учетом сезонных колебаний
Слайд 14

Концепция хранилища данных Использование концепции данных в системе поддержки принятия решений

Концепция хранилища данных

Использование концепции данных в системе поддержки принятия решений преследует

следующие цели:
Своевременное обеспечение аналитиков всей информацией, необходимой для выработки решений;
Создание единой модели данных организации;
Создание интегрированного источника данных.
Слайд 15

Концепция хранилища данных Ориентация на предметную область. Хранилище должно разрабатываться с

Концепция хранилища данных

Ориентация на предметную область.
Хранилище должно разрабатываться с учетом специфики

предметной области, а не приложений, оперирующих данными.
Структура хранилища должна отражать представления аналитика об информации, с которой ему приходится работать.
Слайд 16

Концепция хранилища данных Интегрированность. Информация в хранилище загружается из приложений, созданных

Концепция хранилища данных

Интегрированность.
Информация в хранилище загружается из приложений, созданных разными разработчиками.
Необходимо

объединить данные этих приложений, приведя их к единому синтаксическому и семантическому виду.
Слайд 17

Концепция хранилища данных Неизменяемость данных. Данные после загрузки в аналитических системах

Концепция хранилища данных

Неизменяемость данных.
Данные после загрузки в аналитических системах остаются неизменными.
Внесение

каких-либо изменений, кроме добавления записей не предполагаются.
Слайд 18

Концепция хранилища данных Поддержка хронологии. Учет хронологии достигается введением ключевых атрибутов

Концепция хранилища данных

Поддержка хронологии.
Учет хронологии достигается введением ключевых атрибутов «ДАТА» и/или

«ВРЕМЯ» в структуры хранилища данных
Слайд 19

Свойства данных в СППР и системах операционной обработки (OLTP)‏

Свойства данных в СППР и системах операционной обработки (OLTP)‏

Слайд 20

OLAP Под OLAP-системой принято понимать СППР, основанную на концепции хранилища данных

OLAP

Под OLAP-системой принято понимать СППР, основанную на
концепции хранилища данных и

обеспечивающую малое время
выполнения аналитических запросов.
Слайд 21

Модели данных, используемые для построения хранилищ В настоящее время два чем-то

Модели данных, используемые для построения хранилищ

В настоящее время два чем-то конкурирующих,

а в чем-то взаимодополняющих друг друга подхода к построению хранилищ данных:
подход, основанный на использовании многомерной модели БД (Multidimensional OLAP - MOLAP)‏
подход, использующий реляционную модель БД (Relational OLAP - ROLAP)‏
Слайд 22

Многомерная модель хранилища

Многомерная модель хранилища

Слайд 23

Реляционная модель хранилища данных

Реляционная модель хранилища данных

Слайд 24

(Схема «Снежинка»)‏ Реляционная модель хранилища данных

(Схема «Снежинка»)‏

Реляционная модель хранилища данных

Слайд 25

Комбинация многомерного и реляционного подходов: Киоски данных — специализированное тематическое хранилище,

Комбинация многомерного и реляционного подходов:
Киоски данных — специализированное тематическое хранилище,

обслуживающее одно из направлений деятельности организации

Киоски данных
(Data Marts)‏

Слайд 26

Пользовательские приложения

Пользовательские приложения