Консолидация данных

Содержание

Слайд 2

OLTP -On-Line Transaction Processing

OLTP -On-Line Transaction Processing

Слайд 3

Системы поддержки принятия решений -информационные СППР

Системы поддержки принятия решений -информационные СППР

Слайд 4

Концептуальная схема ХД

Концептуальная схема ХД

Слайд 5

Краткий обзор архитектур ХД В настоящее время разработано несколько архитектур хранилищ:

Краткий обзор архитектур ХД

В настоящее время разработано несколько архитектур хранилищ:
Реляционные;
Многомерные;


Гибридные;
Виртуальные.
ХД можно разделить на одноплатформенные и кросс-платформенные.
Одноплатформенные ХД строятся на базе только одной СУБД, а кросс-платформенные могут строиться на базе нескольких СУБД.
Слайд 6

Реляционные ХД Реляционные ХД используют классическую реляционную модель, характерную для оперативных

Реляционные ХД

Реляционные ХД используют классическую реляционную модель, характерную для
оперативных регистрирующих

OLTP-систем.
Данные хранятся в реляционных таблицах, но
образуют специальные структуры эмулирующие многомерное представление данных.
Такая технология обозначается аббревиатурой ROLAP – Relational OLAP.
Слайд 7

Многомерные ХД Многомерные ХД реализуют многомерное представление данных на физическом уровне

Многомерные ХД

Многомерные ХД реализуют многомерное представление данных на физическом уровне

в виде многомерных кубов.
Данная технология получила название MOLAP – Multidimensional OLAP.
Слайд 8

Гибридные ХД Гибридные ХД сочетают в себе свойства как реляционной, так

Гибридные ХД

Гибридные ХД сочетают в себе свойства как реляционной, так

и многомерной моделей данных.
В гибридных ХД детализированные данные хранятся в реляционных таблицах, а агрегаты – в многомерных кубах.
Такая технология построения ХД называется HOLAP – Hybrid OLAP.
Слайд 9

Виртуальные ХД Виртуальные ХД не являются хранилищами данных в привычном понимании.

Виртуальные ХД

Виртуальные ХД не являются хранилищами данных в привычном понимании.

В таких системах работа ведется с отдельными источниками данных, но при этом эмулируется работа обычного ХД.
Иначе говоря, данные не консолидируются физически, а собираются непосредственно в процессе выполнения запроса.
Слайд 10

Многомерные хранилища данных Многомерная модель данных - это многомерные кубы, или

Многомерные хранилища данных

Многомерная модель данных - это многомерные кубы, или гиперкубы

-
упорядоченные многомерные массивы OLAP-кубы
(аббревиатура OLAP расшифровывается как On-Line Analytical Processing – оперативная
аналитическая обработка).
Технология OLAP - методика оперативного извлечения нужной информации из больших массивов данных и формирование отчетов.
Слайд 11

Принцип организации многомерного куба

Принцип организации многомерного куба

Слайд 12

Измерения и факты в многомерном кубе

Измерения и факты в многомерном кубе

Слайд 13

Работа с измерениями В процессе поиска и извлечения из гиперкуба нужной

Работа с измерениями

В процессе поиска и извлечения из гиперкуба нужной информации

над его измерениями
производится ряд действий, наиболее типичными из которых являются:
сечение (срез);
транспонирование;
свертка;
детализация.
Слайд 14

Сечения гиперкуба

Сечения гиперкуба

Слайд 15

Транспонирование (вращение) обычно применяется к плоским таблицам, полученным, например, в результате

Транспонирование (вращение) обычно применяется к плоским таблицам, полученным,
например, в результате среза,

и позволяет изменить порядок представления измерений таким образом, что измерения, отображавшиеся в столбцах, будут отображаться в строках, и
наоборот.
В ряде случаев транспонирование позволяет сделать таблицу более наглядной.
Слайд 16

Результат свертки исходной таблицы по измерению «Товар»

Результат свертки исходной таблицы по измерению «Товар»

Слайд 17

Реляционные хранилища данных На основе реляционных хранилищ данных (РХД) строятся ROLAP-системы,

Реляционные хранилища данных

На основе реляционных хранилищ данных (РХД) строятся ROLAP-системы, и

эта идея тоже принадлежит Кодду.
В основе технологии РХД лежит принцип:
измерения хранятся в плоских таблицах так же, как и в обычных реляционных СУБД,
а факты (агрегируемые данные) – в отдельных специальных таблицах этой же базы данных.
таблица фактов является основой для связанных с ней таблиц измерений.
Слайд 18

Схема построения РХД «звезда»

Схема построения РХД «звезда»

Слайд 19

Схема построения РХД «снежинка»

Схема построения РХД «снежинка»

Слайд 20

Гибридные хранилища данных HOLAP (Hybrid OLAP) OLAP).

Гибридные хранилища данных HOLAP (Hybrid OLAP) OLAP).

Слайд 21

Слайд 22

Витрины данных Витрина данных – специализированное локальное тематическое хранилище, подключенное к

Витрины данных

Витрина данных – специализированное локальное тематическое хранилище, подключенное к централизованному

ХД и обслуживающее отдельное направление деятельности.
Концепция витрины данных заключается в выделении профильных данных в отдельный набор и в организации его хранения в отдельной многомерной БД, подключенной к централизованному РХД.
Слайд 23

Консолидация с использованием витрин данных

Консолидация с использованием витрин данных

Слайд 24

Слайд 25

Виртуальные хранилища данных Виртуальное хранилище данных - система, которая работает с

Виртуальные хранилища данных

Виртуальное хранилище данных - система, которая работает с разрозненными

источниками данных и эмулирует работу обычного хранилища данных,
извлекая,
преобразуя и
интегрируя данные
непосредственно в процессе выполнения запроса.

ВХД поддерживает историческую информацию только за период актуальности OLTP-систем, применение такого хранилища оправданно лишь тогда, когда исторические данные для анализа не требуются.

Слайд 26

Виртуальное ХД

Виртуальное ХД