Учебный курс Хранилища данных Лекция 1 Понятия о хранилищах Лекции читает Кандидат технических наук, доцент Перминов Генн
Содержание
- 2. Хранилище – компонент BI
- 3. Место хранилища в информационной технологии поддержки принятия решений Системы поддержки принятия решений Спец. Отчеты Аналитические приложения
- 4. Расхождения в требованиях к хранению данных в БД и ХД Особенности данных для принятия решений
- 5. Продолжение таблицы
- 6. Появление хранилищ вызвано, двумя причинами: аналитическая работа с данными в ХД (специализированных БД) не сказывается на
- 7. Почему нельзя использовать традиционные БД в процессе принятия решений? недостоверность данных; низкая производительность при нестандартных запросах;
- 8. Опыт использования БД Подводя итоги, можно отметить, что, несмотря на обилие данных, возможностей их сбора и
- 9. Вывод из опыта использования БД Возникает необходимость в технологиях, позволяющих автоматически собирать данные из различных баз
- 10. Требования к Хранилищам данных для руководящего состава и аналитиков ХД должно быть предметно-ориентированным, интегрированным, предназначенным для
- 11. Основные составляющие Хранилища данных: предметная ориентированность; интегрированность (целостность и внутренняя взаимосвязь); временная привязка; неразрушаемая совокупность данных.
- 12. Предметная ориентированность: Локальные базы данных содержат мегабайты информации, абсолютно не нужной для анализа (адреса, почтовые индексы,
- 13. Интегрированность (целостность и внутренняя взаимосвязь): Несмотря на то что данные погружаются из различных источников, но они
- 14. Временная привязка: Оперативные системы охватывают небольшой интервал времени, что достигается за счет периодического архивирования данных. DW,
- 15. Неразрушаемая совокупность данных : Модификация данных не производится, поскольку может привести к нарушению их целостности. Поскольку
- 16. Особенности хранилищ данных: Хранилища данных содержат информацию, собранную из нескольких оперативных баз данных. Хранилища, как правило,
- 17. Разновидности хранилищ – витрины данных: Поскольку конструирование хранилища данных — сложный процесс, который может занять несколько
- 18. Компонента— средства извлечения, преобразования и загрузки данных: этап извлечения и преобразования; этап очистки данных; этап загрузки;
- 19. Этап извлечения и преобразования Цель этапа извлечения данных — перенести данные из разнородных источников в базу
- 20. Этап очистки данных Ошибки при вводе данных и различия в схемах могут привести к тому, что
- 21. Этап загрузки После того, как данные извлечены и преобразованы, возможно, что их еще необходимо дополнительно обработать
- 22. Этап обновления Должны быть рассмотрены два вопроса: когда обновлять и как обновлять: 1. Обычно хранилища данных
- 23. Управление метаданными Метаданные — информация любого рода, которая требуется для управления хранилищем данных, а управление метаданными
- 24. Технологии хранения данных
- 25. 1.Денормализованные, пространственные базы данных
- 26. Одним из направлений развития РБД в интересах систем принятия решений является разработка таблиц с денормализованной формой
- 27. Нормализация данных в реляционных СУБД приводит к созданию множества связанных между собой таблиц. В результате, выполнение
- 28. Как проектировать ненормализованную БД? Большинство Case – средств проектирования БД поддерживает методологию моделирования хранилищ благодаря использованию
- 29. Особенности проектирования Моделирование Dimensional сходно с моделированием связей и сущностей для реляционной модели, но отличаются целями.
- 30. О схеме звезда В размерном моделировании принят стандарт модели, называемый схемой звезда (star schema), которая обеспечивает
- 31. Основные составляющие структуры хранилищ данных Схема звезда обычно содержит одну большую таблицу, называемую таблицей факта (fact
- 32. Структура ХД - звезда
- 33. Структура ХД - снежинка
- 34. Обозначения таблиц в схеме “звезда”
- 35. Таблица(ы) фактов Прежде чем создать DW со схемой типа звезда, необходимо проанализировать бизнес-правила предметной области с
- 36. О связи таблицы фактов с таблицами измерений Таблица факта является центральной таблицей в схеме звезда. Она
- 37. Первичный ключ (таблица факта “REVENUE”) составлен из четырех внешних ключей: movie_key, market_key, customer_key и time_key
- 38. Наиболее часто встречающихся типы фактов факты, связанные с транзакциями (Transaction facts). Они основаны на отдельных событиях
- 39. О детализации фактов Для многомерного анализа пригодны таблицы фактов, содержащие как можно более подробные данные (то
- 40. Правила агрегации данных В таблице фактов нет никаких сведений о том, как группировать записи при вычислении
- 41. Таблицы измерений Таблицы измерений содержат неизменяемые либо редко изменяемые данные (типа справочник). В подавляющем большинстве случаев
- 42. Отличие от схемы «звезда» Если хотя бы одно измерение содержится в нескольких связанных таблицах, такая схема
- 43. Связи консольных таблиц Консольные таблицы могут быть связаны только таблицами размерности, причем консольная таблица в этой
- 44. Закладка Dimensional диалога Table Editor В диалоге описания свойств таблицы Table Editor имеется закладка Dimensional, в
- 45. Правила хранения данных (Data Warehouse Rules) Для каждой таблицы можно задать шесть типов правил манипулирования данными:
- 47. Скачать презентацию