Реляционная модель данных. (Лекция 3)

Содержание

Слайд 2

Из истории РМД 19 августа 1969 года вышла статья Эдгара Кодда

Из истории РМД

19 августа 1969 года вышла статья Эдгара Кодда посвященная

реляционному представлению данных. Т.о. данный подход существует уже более 40 лет
Реляционная модель данных жива и здравствует, и пока что не видно реальных претендентов на ее замену. Возможно, это объясняется отсутствием в настоящее время в сообществе баз данных людей масштаба доктора Кодда, но, скорее всего, просто отсутствуют потребности в других абстрактных средствах представления данных. Все существующие модели происходят из нее и на ее базе.

С другой стороны, современное представление "истинной" реляционной модели данных обеспечивается в работах последних десятилетий Криса Дейта и Хью Дарвена. Не нарушая предписания, сформулированные в первых статьях Эдгара Кодда Дейт и Дарвен предлагают концепцию построения новых СУБД.
Сам термин «реляционная модель» у Кодда появилась только в 1979 году, а понятие модели– только в 1981

Слайд 3

Основные понятия РМД Реляционная модель данных (РМД, relation – отношение, математический

Основные понятия РМД

Реляционная модель данных (РМД, relation – отношение, математический термин,

обозначающий таблицу) – это теория данных, основанная на некоторых положениях математики (теория множеств и предикативной логики).
Любое предприятие имеет большое количество данных, связанных с его деятельностью (о продукции, о счетах, о планировании, о студентах и др.) Эти данные представляют основные объекты, они связаны между собой отношениями. Поэтому в БД отражаются и объекты и отношения между ними.
Слайд 4

Основные принципы РМД Основные принципы РМД: представление данных в виде таблиц;

Основные принципы РМД

Основные принципы РМД:
представление данных в виде таблиц;
использование стандартных операторов

обработки данных, позволяющих генерировать новые таблицы на основе существующих.
РМД характеризуется структурой данных, целостностью и обработкой данных.
Слайд 5

Основные понятия РМД Структура данных связана с несколькими понятиями: отношение –

Основные понятия РМД

Структура данных связана с несколькими понятиями: отношение – это

данные представленные в виде таблицы; таблица состоит из строк и столбцов. Строка таблицы называется кортежем, количество кортежей – кардинальным числом. Столбец – атрибутом, количество атрибутов – степенью. Каждая строка содержит запись БД. Каждая запись одной таблицы содержит равное количество полей. В таблице не должно быть одинаковых записей (кортежей). Каждая запись характеризуется уникальным идентификатором, который называется первичный ключ.
Слайд 6

Виды отношений в РМД Целостность данных обеспечивается наличием ключей и связями,

Виды отношений в РМД

Целостность данных обеспечивается наличием ключей и связями, устанавливаемыми

между таблицами.
Связи между таблицами устанавливаются на базе следующих возможных типов отношений:
один к одному (о-о);
один ко многим (о-м);
много к одному (м-о);
много ко многим (м-м).
Слайд 7

Виды отношений в РМД

Виды отношений в РМД

Слайд 8

Операции над данными Обработка данных подразумевает совокупность возможных операций над БД.

Операции над данными

Обработка данных подразумевает совокупность возможных операций над БД.
Следует

рассмотреть следующие виды операций:
над строками;
над таблицами (отношениями);
специальные.
Слайд 9

Операции над данными в РМД (на уровне строк) На уровне строк

Операции над данными в РМД (на уровне строк)

На уровне строк БД

возможно их удаление, обновление, добавление.
Слайд 10

Операции над данными в РМД (на уровне таблиц) На уровне таблиц

Операции над данными в РМД (на уровне таблиц)

На уровне таблиц –

объединение таблиц, пересечение, разность, декартово произведение (над таблицами разной структуры – результат – все возможные сочетания – ненормализованная таблица с полной информацией об объекте). Остальные операции производятся над таблицами одинаковой структуры.
Слайд 11

Объединение – новая таблица (отношение) на базе двух существующих, включающая все

Объединение – новая таблица (отношение) на базе двух существующих, включающая все

кортежи, принадлежащие и первому отношению и второму.
Вычитание – возвращает отношение, содержащее все кортежи, которые принадлежат первому и не принадлежат второму
Пересечение – возвращает отношение, содержащее все кортежи, принадлежащие и первому и второму отношениям.

Операции над данными в РМД (на уровне таблиц)

Слайд 12

Произведение декартово – возвращает отношение, содержащее всевозможные кортежи, которые являются сочетанием

Произведение декартово – возвращает отношение, содержащее всевозможные кортежи, которые являются сочетанием

двух кортежей, принадлежащих двум отношениям.

Произведение декартово – возвращает отношение, содержащее всевозможные кортежи, которые являются сочетанием двух кортежей, принадлежащих двум отношениям.

Слайд 13

Операции над данными в РМД (специальные) Специальные операции – выборка данных,

Операции над данными в РМД (специальные)

Специальные операции – выборка данных, проекция

и др.
Выборка – возвращает отношение, содержащее все кортежи, удовлетворяющие определенным условиям.
Проекция – возвращает отношение, содержащее все кортежи существующего отношения после исключения из него некоторых атрибутов.
Слайд 14

Нормализация таблиц При проектировании РБД необходимо обеспечить эффективную работу с данными,

Нормализация таблиц

При проектировании РБД необходимо обеспечить эффективную работу с данными, поэтому

следует организовывать такую структуру, которая позволит:
организовать быстрый доступ к данным;
исключить ненужное повторение данных, которое может являться причиной ошибок при вводе и нерациональное использование дискового пространства;
обеспечить целостность данных так, чтобы при изменении одних данных происходило автоматическое изменение связанных с ними данных.
Процесс уменьшения избыточности данных называется нормализацией таблицы.
Слайд 15

Нормализация таблиц При существенном дублировании данных таблица называется ненормализованной. Из нее

Нормализация таблиц

При существенном дублировании данных таблица называется ненормализованной. Из нее можно

сформировать несколько нормализованных таблиц и установить между ними связи.
Связи устанавливаются между первичным ключом и совпадающими полями другой таблицы. Первичный ключ однозначно определяет запись в таблице, таким ключом может быть код детали, порядковый номер в списке и т.д. Внешний ключ – это поле, содержащее такой же тип информации в таблице, которая является подчиненной.
Слайд 16

Нормализация таблиц ненормализованная таблица нормализованные таблицы Следует различать простое (неизбыточное) и

Нормализация таблиц

ненормализованная таблица
нормализованные таблицы

Следует различать простое (неизбыточное) и избыточное дублирование данных.

Наличие первого допускается в РБД. Второе может приводить к проблемам при обработке данных. Пример избыточного дублирования:
Слайд 17

Нормализация таблиц Существует следующая последовательность нормальных форм: первая нормальная форма (1НФ);

Нормализация таблиц

Существует следующая последовательность нормальных форм:
первая нормальная форма (1НФ);
вторая нормальная форма

(2НФ);
третья нормальная форма (3НФ);
нормальная форма Бойса-Кодда (БКНФ);
четвертая нормальная форма (4НФ);
пятая нормальная форма (5НФ)
и еще 2 формы сформулированы в последнее время.
Каждая форма – свод правил и ограничений, которые необходимо соблюсти при формировании таблиц.
Слайд 18

Нормализация таблиц

Нормализация таблиц

Слайд 19

Нормализация таблиц

Нормализация таблиц

Слайд 20

Достоинства и недостатки РМД Достоинства РМД: простота представления данных (таблицы просты

Достоинства и недостатки РМД

Достоинства РМД:
простота представления данных (таблицы просты для восприятия

информации);
минимальная избыточность данных при нормализации таблиц;
универсальность процедур обработки данных.
Недостатки РМД:
фрагментация данных, из-за нормализации таблиц, а в большинстве задач требуется общая картина данных, но эта проблема может быть разрешена через различные средства СУБД – выборку данных в запросах и формирование отчетов на основе данных из различных связанных между собой таблиц.