Язык разметки XML

Содержание

Слайд 2

Вопросы История появления языков разметки Перечислить и объяснить недостатки HTML Архитектура

Вопросы

История появления языков разметки
Перечислить и объяснить недостатки HTML
Архитектура документов XML
Перечислить преимущества

XML
Синтаксический анализатор
Компоненты документа XML
Символьные данные
Комментарии
Инструкции обработки
Примитивы
Общие примитивы
Объявления DOCTYPE
Ссылки на примитивы
Слайд 3

История средств разметки Документы записываются с помощью бумаги и ручки Наборщики

История средств разметки

Документы записываются с помощью бумаги и ручки

Наборщики форматируют документы

Средства,

используемые наборщиками для форматирования документа
Слайд 4

Язык разметки Язык разметки определяет правила, которые помогают добавить смысловое значение

Язык разметки

Язык разметки определяет правила, которые помогают добавить смысловое значение к

содержимому и структуре документов
Языки классифицируются, как:
Stylistic Markup (Стилистическая разметка) – Определяет представление документа
Structure Markup (Структурная разметка) – Определяет структуру документа
Semantic Markup (Семантическая или Смысловая разметка) – Определяет содержимое документа
Слайд 5

SGML Система форматирования документов была названа Generalized Markup Language (GML) –

SGML

Система форматирования документов была названа Generalized Markup Language (GML) – Язык

разметки общего назначения
Язык GML тщательно разрабатывался и дорабатывался и в конечном итоге стал известен, как Standard Generalized Markup Language (SGML) – Стандартный язык разметки
SGML считается родоначальником всех языков разметки
Слайд 6

Возможности языка SGML Описывает язык разметки, позволяющий авторам создавать собственные тэги,

Возможности языка SGML

Описывает язык разметки, позволяющий авторам создавать собственные тэги, связанные

с содержанием
Необходим файл, который должен содержать все правила этого языка для его интерпретации
Язык разметки, производный от SGML, называется приложением SGML
Слайд 7

HTML HTML – это самый известный язык разметки, являющийся производным от

HTML

HTML – это самый известный язык разметки, являющийся производным от SGML
Он

был создан для разметки технической документации, с тем, чтобы документы могли бы передаваться между различными платформами в научном сообществе
Сейчас он используется и многими другими пользователями, которые заинтересованы в визуальном представлении своих документов
Слайд 8

Недостатки HTML Фиксированный набор тэгов Технология представления не связана с содержанием

Недостатки HTML

Фиксированный набор тэгов
Технология представления не связана с содержанием
«Плоская» разметка
Излишнее количество

служебных данных
HTML не является международным языком
Невозможен обмен данными
Не имеет надёжного механизма связывания
HTML не обеспечивает повторное использование
Слайд 9

Примеры кода HTML и XML TOM CRUISE CLIENT ID : 100

Примеры кода HTML и XML


  • TOM CRUISE

    • CLIENT

ID : 100
  • COMPANY : XYZ Corp.
  • Email : tom@usa.net
  • Phone : 3336767
  • Street Adress : 25th St.
  • City : Toronto
  • State : Toronto
  • Zip : 20056




    TOM CRUISE
    100
    XYZ Corp.
    tom@usa.net
    3336767
    25th St.
    Toronto
    Toronto
    20056


    Код HTML

    Код XML

  • Слайд 10

    XML XML – это аббревиатура от Extensible Markup Language (XML) –

    XML

    XML – это аббревиатура от Extensible Markup Language (XML) – расширяемый

    язык разметки
    Устраняет все недостатки, присущие HTML
    Позволяет пользователю определить собственный набор тэгов, а также даёт возможность понять их и другим пользователям
    Гораздо более гибкий язык, чем HTML
    Наследует свойства языка SGML и объединяет их с положительными свойствами HTML
    Является более компактной версией SGML
    Слайд 11

    XML XML – это метаязык, который описывает другие языки Данные, содержащиеся

    XML

    XML – это метаязык, который описывает другие языки
    Данные, содержащиеся в файле

    XML, могут быть выведены различными способами
    Данные также могут быть переданы в другие приложения для дальнейшей обработки
    Таблицы стилей (Style sheets) помогают преобразовать структурированные данные в различные HTML-представления для вывода данных в различных браузерах
    Слайд 12

    Архитектура XML XML поддерживает трёхзвенную архитектуру для обработки и манипулирования данными

    Архитектура XML

    XML поддерживает трёхзвенную архитектуру для обработки и манипулирования данными
    Может быть

    сгенерирован из существующих баз данных с использованием масштабируемой трёхзвенной модели
    Тэги XML представляют логическую структуру данных, которая может быть интерпретирована и использована различными способами в многочисленных приложениях
    Среднее звено используется для доступа к многочисленным базам данных и трансляции данных в формат XML
    Слайд 13

    XML архитектура Настольный компьютер Среднее звено Хранение Вывод Несколько видов, созданных

    XML архитектура

    Настольный компьютер

    Среднее звено

    Хранение

    Вывод
    Несколько видов, созданных из данных, основанных на XML

    Доставка

    и обработка данных
    Обмен данными в формате XML через HTTP

    Интеграция данных
    XML создаётся или генерируется

    XML

    База данных Мэйнфрейма

    Web‑сервер
    Доступ к БД, бизнес‑правила интеграции

    Вид 1

    Вид 2

    Слайд 14

    XML – универсальный формат данных HTML – это один язык разметки,

    XML – универсальный формат данных

    HTML – это один язык разметки, а

    XML является семейством языков разметки
    Любой тип данных может быть с лёгкостью определён в XML
    XML популярен, благодаря широкому спектру областей его применения, а также потому, что он прост в использовании
    XML имеет структурированный формат данных, который позволяет хранить сложные (составные) данные
    Слайд 15

    Преимущества XML Трёхзвенная архитектура обеспечивает лёгкость масштабирования и улучшенную безопасность Преимущества

    Преимущества XML

    Трёхзвенная архитектура обеспечивает лёгкость масштабирования и улучшенную безопасность
    Преимущества XML классифицируются

    следующим образом:
    Преимущества в области бизнеса
    Технологические преимущества
    Слайд 16

    Преимущества в области бизнеса Совместное использование информации Позволяет отраслям бизнеса определять

    Преимущества в области бизнеса

    Совместное использование информации
    Позволяет отраслям бизнеса определять собственные форматы

    данных в XML, с лёгкостью создавать средства для чтения этих данных, для записи данных и для преобразования данных между XML и другими форматами
    XML в составе одного приложения
    Весьма мощный и гибкий язык для описания сложных свойств реального мира
    Расширяемость – даёт приложению возможность дальнейшего роста и разработки без каких-либо радикальных изменений
    Доставка содержания
    Способность поддерживать различных пользователей и информационные каналы (механизмы доставки информации) для построения более эффективных приложений
    Слайд 17

    Технологические преимущества Технологические преимущества Повторное использование данных Разделение данных и представления Расширяемость Семантическая информация

    Технологические преимущества

    Технологические преимущества

    Повторное использование данных

    Разделение данных и представления

    Расширяемость

    Семантическая информация

    Слайд 18

    Реальное использование языка XML EDI документы электронные SABRE (сфера международного туризма)

    Реальное использование языка XML

    EDI документы электронные
    SABRE (сфера международного туризма)
    Chemical Markup Language

    (химический язык разметки)
    Слайд 19

    Структура документа XML Документ XML состоит из наборов «примитивов» («entities»), идентифицируемых

    Структура документа XML

    Документ XML состоит из наборов «примитивов» («entities»), идентифицируемых по

    неповторяющимся, уникальным именам
    Все документы начинаются с примитива «корневой» (root) или «документ» (document)
    Примитивы – это псевдонимы для более сложных функций
    Документы логически состоят из объявлений, элементов, комментариев, символьных ссылок и инструкций обработки
    Слайд 20

    Правильно сформированные и корректные документы Спецификация XML 1.0 определяет синтаксис XML

    Правильно сформированные и корректные документы

    Спецификация XML 1.0 определяет синтаксис XML
    Документ считается

    правильно сформированным, если он удовлетворяет минимальному набору требований, определённых пользователем
    Требования гарантируют, что используются правильные языковые конструкции, что они используются по назначению, именно так, как определено спецификацией языка XML.
    Корректный документ – это правильно сформированный документ, который к тому же полностью соответствует правилам, определённым в DTD
    DTD определяет правила, по которым XML выполняет разметку в документе, и должен неукоснительно их соблюдать.
    Слайд 21

    Синтаксические анализаторы Синтаксические анализаторы помогают компьютеру интерпретировать файл XML Существуют два

    Синтаксические анализаторы
    Синтаксические анализаторы помогают компьютеру интерпретировать файл XML
    Существуют два типа синтаксических

    анализаторов:
    Синтаксический анализатор без проверки корректности
    Синтаксический анализатор с проверкой корректности
    Слайд 22

    Синтаксические анализаторы XML файл Прочие связанные файлы (такие, как DTD файл)

    Синтаксические анализаторы

    XML файл

    Прочие связанные файлы (такие, как DTD файл)

    Синтаксический анализатор загружает

    XML и другие связанные файлы для проверки: является ли документ XML правильно сформированным и корректным

    Дерево данных

    Слайд 23

    Данные и разметка Документ XML Данные Текст, который описывает данные –

    Данные и разметка

    Документ XML
    Данные
    Текст, который описывает данные – Разметка
    Тэги и

    - это разметка
    ‘ЛЦПбп-17-1’ – это символьные данные

    ЛЦПбп-17-1

    Слайд 24

    Создание документа XML Этапы, которые вы должны пройти для создания документа

    Создание документа XML

    Этапы, которые вы должны пройти для создания документа XML
    Составление

    декларации XML
    Создание корневого элемента
    Создание кода XML
    Проверка документа
    Слайд 25

    Составление декларации XML Помогает браузеру и читателю документа обработать документ Синтаксис

    Составление декларации XML

    Помогает браузеру и читателю документа обработать документ
    Синтаксис

    Декларация XML

    не является обязательной
    Версия XML 1.0 принята по умолчанию
    Сообщает синтаксическому анализатору и другим приложениям о способе, которым должны быть обработаны данные в файле


    Атрибуты “standalone” и “encoding” не являются обязательными, только номер версии обязателен
    ‘Standalone’ определяет, используется ли внешняя декларация или не используется
    ‘Encoding’ определяет кодировку символов, используемую автором

    Слайд 26

    Создание корневого элемента Может существовать только один корневой элемент Он описывает

    Создание корневого элемента

    Может существовать только один корневой элемент
    Он описывает функцию документа
    Каждый

    документ XML обязательно должен содержать корневой элемент




    Слайд 27

    Создание кода XML Это процесс создания собственных элементов и атрибутов в

    Создание кода XML

    Это процесс создания собственных элементов и атрибутов в соответствии

    с требованиями нашего приложения
    Элементы – это базовые единицы содержимого XML
    Тэги сообщают пользовательскому агенту, что нужно сделать с содержимым, заключённым между начальным и конечным тэгами

    Открывающий Содержание Закрывающий
    тэг тэг
    Группа ЛЦПбп

    Элемент

    Части элемента

    Слайд 28

    Комментарии Специальная информация, которая приводится в документе для того, чтобы в

    Комментарии

    Специальная информация, которая приводится в документе для того, чтобы в будущем

    читатель мог с нею ознакомиться, и которая должна игнорироваться процессором, называется комментариями
    Синтаксис

    Пример

    TOM CRUISE

    Приведённый пример должен вывести только имя TOM CRUISE, а другие имена воспринимаются, как комментарии

    Слайд 29

    Инструкции обработки Обработка информации является частью информации, значимой для приложения, использующего

    Инструкции обработки

    Обработка информации является частью информации, значимой для приложения, использующего документ

    XML.
    Эти инструкции передаются непосредственно в приложение с помощью синтаксического анализатора.
    Декларация XML – это также агент обработки


    Имя приложения

    Информационная инструкция

    Слайд 30

    Символьные данные Текст между начальным и конечным тэгами определяется, как "символьные

    Символьные данные

    Текст между начальным и конечным тэгами определяется, как "символьные данные"

    (‘character data’)
    Символьные данные могут быть любыми допустимыми символами (Unicode)
    Символьные данные делятся на:
    PCDATA
    CDATA
    Слайд 31

    PCDATA Это означает parsed character data (обрабатываемые символьные данные) PCDATA –

    PCDATA

    Это означает parsed character data (обрабатываемые символьные данные)
    PCDATA – это текст,

    который будет обрабатываться синтаксическим анализатором
    Тэги в этом тексте будут восприняты, как разметка, а примитивы будут развёрнуты.

     

    Предопределённые примитивы

    Слайд 32

    CDATA Это означает character data (символьные данные) Не обрабатываются синтаксическим анализатором

    CDATA

    Это означает character data (символьные данные)
    Не обрабатываются синтаксическим анализатором
    CDATA используются для

    обеспечения удобства включения больших блоков специальных символов.
    Строку символов ‘]]>’ нельзя использовать внутри блока CDATA, так как она сигнализирует об окончании блока CDATA.



    TOM CRUISE
    tom@usa.com
    ]]>

    Пример

    Слайд 33

    Примитивы Примитивы (Entities) используются в документе, чтобы сократить трудозатраты в тех

    Примитивы

    Примитивы (Entities) используются в документе, чтобы сократить трудозатраты в тех случаях,

    когда необходимо многократно вводить большие фрагменты текста в документ.
    Существуют две категории примитивов:
    Общие примитивы (General entities)
    Синтаксис

    Параметризованные примитивы (Parameter entities)
    Синтаксис

    Слайд 34

    Примеры использования примитивов Параметризованные примитивы: Объявление примитива Синтаксис %PARAMETER_ENTITY_NAME; Пример %address;

    Примеры использования примитивов

    Параметризованные примитивы:
    < CLIENT = "&APTECH;" PRODUCT = "&PRODUCT_ID;" QUANTITY

    = "15">
    Объявление примитива
    Синтаксис
    %PARAMETER_ENTITY_NAME;
    Пример
    %address;

    Объявление примитива:

    Объявление примитива
    Синтаксис
    &ENTITY_NAME;
    Пример
    &address;

    Слайд 35

    Декларации DOCTYPE Декларация следует за декларацией XML в документе XML Синтаксис

    Декларации DOCTYPE

    Декларация следует за декларацией XML в документе XML
    Синтаксис

    version="1.0"?>
    ...здесь объявляются примитивы....

    ...тело документа....

    Пример



    ]>

    Слайд 36

    Атрибуты Атрибут даёт информацию об элементе Атрибуты включаются в стартовый тэг

    Атрибуты

    Атрибут даёт информацию об элементе
    Атрибуты включаются в стартовый тэг элемента
    Атрибут состоит

    из имени атрибута и значения атрибута

    Пример
    SONY
    IBM

    Слайд 37

    Выводы Язык разметки определяет набор правил, которые добавляют смысловую нагрузку к

    Выводы

    Язык разметки определяет набор правил, которые добавляют смысловую нагрузку к содержанию

    и структуре документов.
    XML – это расширяемый язык, то есть мы можем определить собственный набор тэгов, и дать возможность другим сторонам (людям или программам) знать и понимать эти тэги. Это делает XML гораздо более гибким языком, чем HTML.
    XML наследует свойства языка SGML и объединяет их с положительными свойствами HTML. XML может быть сгенерирован из существующих баз данных с использованием масштабируемой трёхзвенной модели. Основанные на XML данные не содержат информации о том, каким образом должны выводиться данные.
    Документ XML состоит из наборов "примитивов" (“entities”), идентифицируемых по неповторяющимся, уникальным именам.
    Правильно сформированный документ – это такой документ, который соответствует основным правилам XML.
    Синтаксический анализатор помогают компьютеру интерпретировать файл XML.