Формат сериализованного объекта в Java. (Лекция 10)

Содержание

Слайд 2

Формат сериализованного объекта Рассмотрим вид сериализованного объекта TestSerial, класс TestSerial имеет

Формат сериализованного объекта
Рассмотрим вид сериализованного объекта
TestSerial, класс TestSerial имеет вид
class parent

implements Serializable {   int parentVersion = 10;}
сlass contain implements Serializable{   int containVersion = 11;}
public class SerialTest extends parent implements
Serializable {   int version = 66;   contain con = new contain();   public int getVersion(){     return version;  }
Слайд 3

public static void main(String args[]) throws IOException { FileOutputStream fos =

public static void main(String args[]) throws IOException {
FileOutputStream fos =

new FileOutputStream("temp.out");
ObjectOutputStream oos = new ObjectOutputStream(fos);
SerialTest st = new SerialTest();
   oos.writeObject(st);
   oos.flush();
   oos.close();
 }
}
В файле temp.out сериализованный объект st будет иметь вид
Слайд 4

AC ED 00 05 73 72 00 0A 53 65 72

AC ED 00 05 73 72 00 0A 53 65 72

69 61 6C 54 65
73 74 05 52 81 5A AC 66 02 F6 02 00 02 49 00 07
76 65 72 73 69 6F 6E 4C 00 03 63 6F 6E 74 00 09
4C 63 6F 6E 74 61 69 6E 3B 78 72 00 06 70 61 72
65 6E 74 0E DB D2 BD 85 EE 63 7A 02 00 01 49 00
0D 70 61 72 65 6E 74 56 65 72 73 69 6F 6E 78 70
00 00 00 0A 00 00 00 42 73 72 00 07 63 6F 6E 74
61 69 6E FC BB E6 0E FB CB 60 C7 02 00 01 49 00
0E 63 6F 6E 74 61 69 6E 56 65 72 73 69 6F 6E 78
70 00 00 00 0B
Рассмотрим, что представляют собой байты в сериализованном объекте:
Слайд 5

AC ED: STREAM_MAGIC. Говорит о том, что используется протокол сериализации. 00

AC ED: STREAM_MAGIC. Говорит о том, что используется протокол сериализации.
00

05: STREAM_VERSION. Версия сериализации.
0x73: TC_OBJECT. Обозначение нового объекта.
0x72: TC_CLASSDESC. Обозначение нового класса.
00 0A: Длина имени класса.
53 65 72 69 61 6c 54 65 73 74: SerialTest, имя класса.
05 52 81 5A AC 66 02 F6: SerialVersionUID, идентификатор класса.
Слайд 6

0x02: Различные флаги. Этот специфический флаг говорит о том, что объект

0x02: Различные флаги. Этот специфический флаг говорит о том, что объект

поддерживает сериализацию.
00 02: Число полей в классе.
алгоритм записывает поле int version = 66:
0x49: Код типа поля. 49 это «I», которое закреплено за int.
00 07: Длина имени поля.
76 65 72 73 69 6F 6E: version, имя поля.
Далее алгоритм записывает следующее поле, contain con = new contain();
0x74: TC_STRING. Обозначает новую строку.
00 09: Длина строки.
4C 63 6F 6E 74 61 69 6E 3B: Lcontain;, Каноническое JVM обозначаение(т.к. это объект).
0x78: TC_ENDBLOCKDATA, Конец опционального блока данных для объекта.
Слайд 7

Затем идет описание класса parent: 0x72: TC_CLASSDESC. Обозначение нового класса 00

Затем идет описание класса parent:
0x72: TC_CLASSDESC. Обозначение нового класса
00 06:

Длина имени класса.
70 61 72 65 6E 74: parent, имя класса
0E DB D2 BD 85 EE 63 7A: SerialVersionUID, идентификатор класса.
0x02: Различные флаги. Этот флаг обозначает что класс поддерживает сериализацию.
00 01: Число полей в классе.
Далее идет описание полей класса parent, класс имеет одно поле,
int parentVersion = 100
Слайд 8

0x49: Код типа поля. 49 обозначает «I», которое закреплено за Int.

0x49: Код типа поля. 49 обозначает «I», которое закреплено за Int.


00 0D: Длина имени поля.
70 61 72 65 6E 74 56 65 72 73 69 6F 6E: parentVersion, имя поля.
0x78: TC_ENDBLOCKDATA, конец опционального блока данных для объекта.
0x70: TC_NULL, обозначает то что больше нет суперклассов, потому что мы достигли верха иерархии классов.
Теперь будут записаны фактические данные ассоциированные с объектом:
Слайд 9

00 00 00 0A: 10, значение parentVersion 00 00 00 42:

00 00 00 0A: 10, значение parentVersion
00 00 00 42: 66,

значение version в SerialTest.
Далее записана информация об объекте класса contain.
contain con = new contain();
Для этого делается описание класса contain
0x73: TC_OBJECT, обозначает новый объект.
0x72: TC_CLASSDESC, обозначает новый класс.
00 07: Длина имени класса.
63 6F 6E 74 61 69 6E: contain, имя класса.
FC BB E6 0E FB CB 60 C7: SerialVersionUID, идентификатор этого класса.
0x02: Различные флаги. Этот флаг обозначает что класс поддерживает сериализацию.
00 01: Число полей в классе.
Слайд 10

Далее идет описание единственного поля класса conatin, int containVersion = 11;

Далее идет описание единственного поля класса conatin, int containVersion = 11;
0x49:

Код типа поля. 49 обозначает «I», которое закреплено за Int.
00 0E: Длина имени поля.
63 6F 6E 74 61 69 6E 56 65 72 73 69 6F 6E: containVersion, имя поля.
0x78: TC_ENDBLOCKDATA, конец опционального блока данных для объекта.
Дальше проверяется, имеет ли contain родительский класс. Если имеет, то алгоритм начинает запись этого класса; но в данном случае суперкласса у contain нету, и алгоритм записывает TC_NULL. 0x70: TC_NULL
Слайд 11

В конце записываются фактические данные ассоциированные с объектом класса conatin: 00

В конце записываются фактические данные ассоциированные с объектом класса conatin:
00 00

00 0B: 11, значение containVersion.
В будущем сериализация будет заменена форматом XML.
Слайд 12

XML Язык разметки XML (Extensible Markup Language) был разработан W3C. Главным

XML

Язык разметки XML (Extensible Markup Language) был разработан W3C.
Главным преимуществом

XML является cовместимость данных, представленных в этом формате, с различными приложениями.
Язык XML был разработан на базе универсального языка разметки SGML.
Язык HTML, как язык разметки гипертекстовых документов, также произошел от SGML.
Слайд 13

Основная идея XML – это текстовое представление с помощью тегов, структурированных

Основная идея XML – это текстовое представление с помощью тегов, структурированных

в виде дерева данных.
Древовидная структура хорошо описывает бизнес-объекты, конфигурацию, структуры данных и т.п.
Кроме того, представление данных в виде XML удобочитаемо.
DTD
Для описания структуры XML-документа используется DTD (Document Type Definition).
DTD определяет, какие теги (элементы) могут использоваться в XML- документе, как эти элементы связаны (например, указывать на то, что элемент включает дочерние элементы и ), какие атрибуты имеет тот или иной элемент
Слайд 14

Cоздавать DTD для XML-документа не обязательно, программы-анализаторы будут обрабатывать XML-файл и

Cоздавать DTD для XML-документа не обязательно, программы-анализаторы будут обрабатывать XML-файл и

без DTD.
Но в этом случае автор должен правильно его сформировать.
Для того чтобы сформировать DTD, можно создать либо отдельный файл и описать в нем структуру документа, либо включить DTD-описание непосредственно в документ XML.
В первом случае имеем


Слайд 15

Во втором случае описание элемента помещается в XML-документ: ... ... ]>

Во втором случае описание элемента помещается в XML-документ:

...

book [

...
]>
Описание элемента
Элемент в DTD описывается с помощью дескриптора !ELEMENT, в котором указывается название элемента и его содержимое.
Слайд 16

Например, определим элемент у которого есть дочерние элементы и , тогда

Например, определим элемент у которого есть дочерние элементы и

, тогда получим описание



В данном случае были определены два элемента price и author и описано их содержимое с помощью маркера PCDATA.
Маркер PCDATA (parseable character data) указывает анализатору, что элементы могут содержать любую информацию, с которой может работать программа-анализатор.
Слайд 17

Кроме маркера PCDATA, есть также маркеры EMPTY –элемент пуст, ANY –

Кроме маркера PCDATA, есть также маркеры
EMPTY –элемент пуст,

ANY – содержимое документа специально не описывается.
При описании элемента , было указано, что он состоит из дочерних элементов и .
Можно расширить это описание с помощью символов ‘+’, ‘*’, ‘?’, используемых для указания количества вхождений элементов.
Так, например,

означает, что элемент book содержит один и только один элемент price, несколько (минимум один) элементов author и необязательный элемент caption (символ * указывает на то, что в составе элемента может содержаться любое, в том числе и нулевое количество элементов)
Слайд 18

Если существует несколько вариантов содержимого элементов, то используется символ ‘|’. Например:

Если существует несколько вариантов
содержимого элементов, то используется
символ ‘|’.
Например:

| body)>
в данном случае элемент book может содержать либо дочерний элемент body, либо PCDATA.
Описание атрибутов
Атрибуты элементов описываются с помощью дескриптора !ATTLIST, внутри которого задаются имя атрибута, тип значения, дополнительные параметры:
Слайд 19

id ID #REQUIRED about CDATA #IMPLIED type (actual | review |

id ID #REQUIRED
about CDATA #IMPLIED
type (actual

| review | teach ) 'actual' >
В данном случае у элемента
определяются три атрибута: id, about, type. Существует несколько возможных значений атрибута, это:
CDATA – значением атрибута является любая последовательность символов;
ID – определяет уникальный идентификатор элемента в документе;
IDREF (IDREFS) – значением атрибута будет идентификатор (список идентификаторов), определенный в документе;
Слайд 20

ENTITY (ENTITES) – содержит имя внешней сущности (несколько имен, разделенных запятыми);

ENTITY (ENTITES) – содержит имя внешней сущности (несколько имен, разделенных запятыми);
NMTOKEN

(NMTOKENS) – слово (несколько слов, разделенных пробелами);
Значением атрибута также может быть перечисление.
Набор допустимых значений помещаются в круглые скобки (значение1| значение2|значение3), затем указывается значение по умолчанию ‘значение1’ .
Значения по умолчанию могут быть следующими:
#REQUIRED – означает, что значение должно присутствовать в документе;
#IMPLIED – означает, что если значение атрибута не задано, то приложение должно использовать свое собственное значение по умолчанию;
Слайд 21

#FIXED – означает, что атрибут может принимать лишь одно значение, то,

#FIXED – означает, что атрибут может принимать лишь одно значение, то,

которое указано в DTD.
Если в документе атрибуту не будет присвоено никакого значения, то его значение будет равно заданному в DTD.
Определение сущности
Сущность представляет собой некоторое определение, чье содержимое может быть повторно использовано в документе.
Описывается сущность с помощью дескриптора !ENTITY:
Слайд 22

... &company; ... Программа-анализатор, которая будет обрабатывать файл, автоматически подставит значение


...
&company;
...
Программа-анализатор, которая будет обрабатывать файл, автоматически подставит значение

Sun Microsystems вместо &company.
В XML включено несколько внутренних определений:
&lt – символ <;
&gt – символ >;
Слайд 23

&ampamp – символ &; &ampapos – символ апострофа ‘; &ampquot –

&amp – символ &;
&apos – символ апострофа ‘;
&quot – символ двойной

кавычки “.
Т.е. объявление помещается между последовательностями символов "" и может быть представлено в одном из перечисленных ниже форматов.
Внутренний примитив. Имени примитива ставится в соответствие значение, используемое в XML-документе.
Если в составе документа встречается выражение &имя_примитива, оно заменяется значением, связанным с именем.

Слайд 24

Внешний примитив XML. Имени примитива ставится в соответствие ХМL документ, URL

Внешний примитив XML. Имени примитива ставится в соответствие ХМL документ, URL

которого указывается в при определении примитива.
Если в составе документа встречается выражение &имя_примитива;, оно заменяется содержимым XML-документа.
В процессе чтения документа производится его разбор

Внешний двоичный примитив. Имени примитива ставится в соответствие набор двоичных данных с заданным URL.
Если при обработке документа встречается выражение
&имя примитива;, оно заменяется данными, тип которых указан в объявлении примитива.
Так, если в объявлении задан тип GIF87A, это означает, что URL указывает на двоичный файл в формате GIF.
В процессе чтения разбор содержимого внешнего двоичного примитива не производится и он может быть использован лишь в атрибуте элемента.

Слайд 25

Пример: Примитив параметра. Имя примитива связывается со значением, которое может быть

Пример:

Примитив параметра. Имя примитива связывается со

значением, которое может быть использовано лишь в составе DTD (но не в XML-документе).
Перед именем такого примитива указывается символ "%", а ссылка на значение примитива задается в DTD в виде %имя примитива DTD).
"значение_примитива_DTD">
Слайд 26

Пусть существует XML-документ, содержащий данные адресной книги: Valera 217819 http://www.aaa.com Main Str., 35 Kiev UKR

Пусть существует XML-документ, содержащий данные адресной книги:

"notepad.dtd">


Valera
217819
http://www.aaa.com

Main Str., 35
Kiev
UKR


Слайд 27

Igor 430797 http://http://www.a.com Deep Forest, 7 Polock VCL Тогда DTD файл будет иметь вид:


Igor
430797
http://http://www.a.com


Deep Forest, 7
Polock
VCL



Тогда DTD файл будет иметь вид:
Слайд 28




(street,city,country)>







Слайд 29

XLink Гипертекстовые средства XML базируются на понятии ресурса. Ресурсами считаются адресуемые

XLink
Гипертекстовые средства XML базируются на понятии ресурса.
Ресурсами считаются адресуемые фрагменты

данных (например, файлы, изображения и приложения).
Связи, или ссылки, отражают отношения между ресурсами.
Локальным ресурсом называется ресурс, который включается в состав связующего XML-элемента.
Удаленный ресурс — это фрагмент данных, на который указывает XML-ссылка.
Связующими элементами называются XML-элементы, в состав которых входят ссылки.
Для реализации ссылки используется атрибут с именем xlink:type.
Слайд 30

Стандартные значения атрибута xlink:type, которые определены спецификацией XLink, перечислены ниже. simple.

Стандартные значения атрибута xlink:type, которые определены спецификацией XLink, перечислены ниже.
simple. Создает

простой связующий элемент, определяющий связь между локальным и удаленным ресурсами.
extended. Создает расширенный связующий элемент, определяющий связь между несколькими ресурсами.
locator. Элемент, определяющий адрес удаленного ресурса.
В составе расширенной ссылки типа extended должен быть задан хотя бы один элемент locator.
Слайд 31

arc. Определяет правила перехода между ссылками, содержащимися в расширенном связующем элементе

arc. Определяет правила перехода между ссылками, содержащимися в расширенном связующем элементе

(типа extended).
title. Задает символьное описание расширенной ссылки.
resource. Определяет локальный ресурс для внешней ссылки.
Если внешняя ссылка использует элемент типа resource, она называется внутренней (inline).
Простые ссылки
Простая ссылка устанавливает связь между локальным и внешним ресурсами.
Формат простой ссылки имеет вид:
Слайд 32

.................................................................. или Для создание простой ссылки используется значение simple атрибута xlink:type.

<имя_элемента xlink:type="simple" xlink:href=“URL”>
..................................................................

или
<имя элемента xlink:type="simple" xlink:href="URL"/>
Для создание простой

ссылки используется значение simple атрибута xlink:type.
В качестве значения атрибута xlink:href указывается URL ресурса.
Например:
xlink:href=“http://www.google.com">
Google Home

Простые ссылки во многом напоминают ссылки, применяемые в HTML-документах.
Связующий элемент, построенный посредством простой ссылки, может отображаться в программах просмотра (например, в Web-броузерах), а путем активизации ссылки (например, по щелчку мыши) можно обратиться к удаленному ресурсу.
Слайд 33

Атрибуты, определяющие поведение ссылок Кроме атрибутов, используемых для связывания ресурсов, существуют

Атрибуты, определяющие поведение ссылок
Кроме атрибутов, используемых для связывания ресурсов, существуют атрибуты,

позволяющие определить дополнительные характеристики связующих элементов:
xlink:title- атрибут задает символьное имя удаленного ресурса;
xlink:role- атрибут определяющий назначение удаленного ресурса.
Значение атрибута xlink:role используется при обработке документа.
Слайд 34

В составе связующего элемента могут также присутствовать атрибуты, задающие поведение ссылки.

В составе связующего элемента могут также присутствовать атрибуты, задающие поведение ссылки.


xlink:show- задает порядок отображения ресурса, на который указывает ссылка.
Значение xlink: show="new" сообщает о том, что удаленный ресурс должен отображаться в новом окне.
Если задано значение xlink:show="replace", удаленный ресурс замещает содержимое текущего окна.
Значение xlink:show="embed" говорит о том, что ресурс, на который указывает ссылка, должен встраиваться в текущий документ.
Слайд 35

xlink:actuate- задает условия активации ссылки. Например, если в документе задано значение

xlink:actuate- задает условия активации ссылки.
Например, если в документе задано значение

xlink:actuate="onLoad", это означает, что приложение должно загрузить удаленный ресурс сразу после разбора ссылки.
Значение link:actuate="onRequest"
указывает на то, что ресурс должен загружаться после того, как пользователь активирует ссылку (например, щелкнет на ней мышью).
Слайд 36

Расширенные ссылки Расширенные ссылки могут использоваться для создания множественных связей. Если

Расширенные ссылки
Расширенные ссылки могут использоваться для создания множественных связей.
Если одна

из связей указывает на локальный элемент, ссылка называется внутренней.
Если все связи указывают на удаленные ресурсы, ссылка называется внешней.
Для идентификации расширенной ссылки используется значение extended атрибута xlink:type.
Локальный ресурс указывается в составе расширенной ссылки как элемент с атрибутом xlink:type="resource".
Слайд 37

Удаленный ресурс, находящийся за пределами расширенной ссылки (например, в составе другого

Удаленный ресурс, находящийся за пределами расширенной ссылки (например, в составе другого

XML-документа), представляется посредством подчиненного элемента с атрибутом xlink:type="locator".
Для идентификации ресурса в элементе такого типа используется URL, который задается в качестве значения атрибута xlink:href.
Слайд 38

Рассмотрим несколько примеров. Предположим, что необходимо выразить на XML отношение между

Рассмотрим несколько примеров.
Предположим, что необходимо выразить на XML отношение между художником

и окружающей его обстановкой.
Это подразумевает создание связей между этим творческим работником и его наследием, а также задание связи к описанию исторических событий, имевших место на протяжении его жизни.
Пусть данные о художнике записаны в следующем файле:
Слайд 39

Modigliani Amadeo July 12, 1884 January 24, 1920 In 1906, Modigliani settled in Paris, where ...



Modigliani
Amadeo


July 12, 1884
January 24, 1920

In 1906, Modigliani settled in Paris,
where ...




Слайд 40

Помимо этого, в отдельные файлы включаются описания периодов, на которые можно

Помимо этого, в отдельные файлы включаются описания периодов, на которые можно

условно разбить его творчество:


Paris
France

Paris in the early 20th century (up to the<br> twenties)
Amadeo

During this period, Russian, Italian, ...



Слайд 41

Рассмотрим решение задачи- создание связей между этим творческим работником и его

Рассмотрим решение задачи- создание связей между этим творческим работником и его

наследием с помощью XLink.
Как уже было сказано, в XLink используются два типа связующих элементов (linking elements): simple (простой) - подобный "a" и "img" в HTML
и extended (расширенный).
Т.е.




Слайд 42

После объявления расширенной связи, необходимо указать задействованные ресурсы. Поскольку информация о

После объявления расширенной связи, необходимо указать задействованные ресурсы.
Поскольку информация о

художнике и его жизни хранится вне документа описывающего художника (и, следовательно, ею невозможно управлять), чтобы ссылаться на нее, необходимо использовать элементы XLink, атрибуты которых имеют значение locator.
Т.е. имеем
Слайд 43

xlink:type="extended"> xlink:href="cezanne.xml"/>

xlink:type="extended">



xlink:href="cezanne.xml"/>





Слайд 44

Уточним данный файл указав отношение между ресурсами:

Уточним данный файл указав отношение между ресурсами:











Слайд 45

Рассмотрим пример документа, содержащего три ссылки на удаленные ресурсы, описывающих разновидности

Рассмотрим пример документа, содержащего три ссылки на удаленные ресурсы, описывающих разновидности

продукта.
Значения атрибута xlink:role могут быть использованы для выбора ресурса наиболее соответствующего интересам заказчика:
xlink:title="BeeShirts.com Sweaters>

BeeShirts has sweater styles to suit you

xlink:role="standard"/>
Слайд 46

xlink:href=“http://www.beeshirts.com/sweaters/calsic/“ xlink:title="Classic Sweater Style“ xlink:role="classic"/> xlink:href=“http://www.beeshirts.com/sweaters/sports/“ xlink:title="Sporty Sweater Style“ xlink:role="sports"/>

xlink:href=“http://www.beeshirts.com/sweaters/sports/“
xlink:title="Sporty Sweater Style“ xlink:role="sports"/>

Слайд 47

Правила перехода будут иметь вид: xlink:title=“BeeShirts.com Sweaters”> ……………. xlink:from="sweaters" xlink:to="classic" xlink:show="replace" xlink:actuate="onRequest"/>

Правила перехода будут иметь вид:
xlink:title=“BeeShirts.com Sweaters”>
…………….
xlink:from="sweaters"

xlink:to="classic" xlink:show="replace" xlink:actuate="onRequest"/>

Слайд 48

Рассмотрим пример простых связей. xlink:type="simple" xlink:href="http://www.users.interport.net/~beand/"> Beth Anderson xlink:type="simple" xlink:href="footnote7.xml"> 7 xmlns:xlink="http://www.w3.org/1999/xlink" xlink:type="simple“ xlink:href="logo.gif" xlink:actuate="onLoad" xlink:show="embed"/>

Рассмотрим пример простых связей.
xlink:type="simple"
xlink:href="http://www.users.interport.net/~beand/">
Beth

Anderson

xlink:type="simple" xlink:href="footnote7.xml">
7

xmlns:xlink="http://www.w3.org/1999/xlink" xlink:type="simple“
xlink:href="logo.gif"
xlink:actuate="onLoad"
xlink:show="embed"/>
Слайд 49

Например, в первом элементе COMPOSER атрибут xlink:href определяет адресат связи. Значение

Например, в первом элементе COMPOSER атрибут xlink:href определяет адресат связи.
Значение атрибута

- абсолютный URL http://www.users.interport.net/~beand/.
Этот связующий элемент описывает соединение элемента COMPOSER текущего документа, содержание которого "Beth Anderson", с удаленным документом в http://www.users.interport.net/~beand/.
На рисунке это можно изобразить следующим образом:
Слайд 50

Слайд 51

Рассмотрим примеры использования атрибута xlink:show. xlink:href="http://www.users.interport.net/~beand/"> Beth Anderson Если значение xlink:show

Рассмотрим примеры использования атрибута xlink:show.
xlink:href="http://www.users.interport.net/~beand/">
Beth Anderson



Если значение xlink:show равно replace, то при активизации связи (как правило, посредством щелчка мышкой по этой связи, например, в браузерах) адресат связи заменяет текущий документ в том же самом окне.
Слайд 52

xlink:type="simple" xlink:show="new" xlink:href="http://www.quackwatch.com/"> Check this out, but don't leave our site

xlink:type="simple"
xlink:show="new" xlink:href="http://www.quackwatch.com/">
Check this out, but don't

leave our site completely!

Если значение xlink:show равно new, то активизация связи вызывает открытие нового окна, в котором отображается адресуемый ресурс.
Слайд 53

xlink:type="simple" xlink:href="images/nypride.jpg" xlink:show="embed" ALT="Marchers on 5th Avenue, June 2000"/> Если значение

xlink:type="simple" xlink:href="images/nypride.jpg" xlink:show="embed"
ALT="Marchers on 5th Avenue, June

2000"/>
Если значение xlink:show равно embed, то при активизации связи адресуемый ресурс вставляется в существующий документ.
Что именно это означает - зависит от приложения.
Слайд 54

XSD Формат xsd идет на смену формату dtd. Рассмотрим пример. Пусть

XSD
Формат xsd идет на смену формату dtd.
Рассмотрим пример. Пусть имеется файл

“заказ на покупку” po.xml:



Alice Smith
123 Maple Street
Mill Valley
CA
90952


Robert Smith
8 Oak Avenue
Old Town
PA
95819

Hurry, my lawn is going wild
Слайд 55

Lawnmower 1 148.95 Confirm this is electric Baby Monitor 1 39.98 1999-05-21



Lawnmower
1

148.95
Confirm this is electric


Baby Monitor
1
39.98
1999-05-21



Слайд 56

Пусть схема документа "Заказ на покупку" содержится в файле po.xsd. xmlns:xsd="http://www.w3.org/2001/XMLSchema">

Пусть схема документа "Заказ на покупку" содержится в файле po.xsd.


xmlns:xsd="http://www.w3.org/2001/XMLSchema">

Purchase order schema for Example.com. Copyright 2000 Example.com. All rights reserved.


type="PurchaseOrderType"/>


Слайд 57



ref="comment" minOccurs="0"/>



Слайд 58

type="xsd:NMTOKEN" fixed="US"/>



name="city" type="xsd:string"/>

type="xsd:NMTOKEN" fixed="US"/>

Слайд 59

maxOccurs="unbounded">



maxOccurs="unbounded">











Слайд 60

minOccurs="0"/> use="required"/>




minOccurs="0"/>

use="required"/>




Слайд 61

Схема заказа на покупку состоит из элемента schema и множества подэлементов,







Схема заказа на покупку состоит из элемента schema и множества подэлементов, среди которых наиболее часто упоминаются element, complexType и simpleType.
Элементы схемы определяют порядок следования элементов и их содержание в документах типа "Заказ на покупку".
Слайд 62

Каждый из элементов в схеме имеет префикс xsd:. Этот префикс связан

Каждый из элементов в схеме имеет префикс xsd:.
Этот префикс связан

с именным пространством XML-схемы через объявление xmlns:xsd=http://www.w3.org/2001/XMLSchema, которое задано в элементе schema.
Префикс xsd: используется в соответствии с соглашением об использовании этого именного пространства для обозначения элементов XML-схемы, хотя можно использовать любой префикс.
Тот же самый префикс, и следовательно, та же самая ассоциация с именным пространством, используется и в названиях встроенных простых типов.
Например, xsd:string.
Слайд 63

Определение комплексных типов, объявление элементов и атрибутов Новые комплексные типы определяются

Определение комплексных типов, объявление элементов и атрибутов
Новые комплексные типы определяются с

помощью оператора complexType.
Такие определения обычно содержат набор из объявлений элементов, ссылок на элементы, и объявлений атрибутов.
Объявления не задают самостоятельно типы. Они создают ассоциации между именем элемента и ограничениями, которые управляют появлением этого имени в документах, соответствующих данной схеме.
Элементы объявляются, с помощью оператора element.
Атрибуты объявляются, с помощью оператора attribute
Слайд 64

Рассмотрим определение комплексного типа USAddress: type="xsd:NMTOKEN" fixed="US"/>

Рассмотрим определение комплексного типа USAddress:


type="xsd:string"/>

type="xsd:NMTOKEN" fixed="US"/>

Слайд 65

В результате этого определения любой элемент типа USAddress, появляющийся в документе

В результате этого определения любой элемент типа USAddress, появляющийся в документе

(например, элемент shipTo в файле po.xml), должен состоять из пяти элементов и одного атрибута.
Имена этих пяти элементов (name, street, city, state и zip) объявляются с помощью атрибута name оператора element, причем элементы должны появиться в той же самой последовательности, в которой они объявлены.
Слайд 66

Определение USAddress содержит объявления, включающие только простые типы: string, decimal и

Определение USAddress содержит объявления, включающие только простые типы: string, decimal и

NMTOKEN.
А определение PurchaseOrderType содержит объявления элементов, имеющих комплексные типы. Например, USAddress.
Оба вида объявлений (простые и комплексные) используют тот же самый атрибут type.
Определение типа PurchaseOrderType имеет вид:
Слайд 67





ref="comment" minOccurs="0"/>




Слайд 68

В определении PurchaseOrderType, объявления элементов shipTo и billTo, связывают различные имена

В определении PurchaseOrderType, объявления элементов shipTo и billTo, связывают различные имена

элементов с одним и тем же комплексным типом, а именно с USAddress.
Элементы shipTo и billTo могут иметь атрибут country, который был объявлен как часть определения USAddress.
Определение PurchaseOrderType содержит объявление атрибута orderDate, который, подобно объявлению атрибута country, задается с помощью простого типа.
Фактически, все объявления атрибутов должны выполняться с помощью простых типов, потому что, в отличие от элементов, атрибуты не могут содержать другие элементы или другие атрибуты.
Слайд 69

Иногда предпочтительно использовать ссылку на существующий тип элемента, а не объявлять

Иногда предпочтительно использовать ссылку на существующий тип элемента, а не объявлять

новый, например:
< xsd:element ref="comment" minOccurs="0"/>
В этом объявлении приводится ссылка на существующий элемент comment, который объявлен где-то в другом месте схемы заказа на закупку.
Значение атрибута ref должно рассматриваться, как ссылка на глобальный элемент, который был объявлен в элементе schema, а не как часть определения комплексного типа.
Вследствие этого элемент comment может появиться в документе внутри элемента PurchaseOrderType, причем его содержание должно быть совместимо с типом string.
Слайд 70

Ограничение вхождений Значение параметра minOccurs равное 0 у элемента comment говорит

Ограничение вхождений
Значение параметра minOccurs равное 0 у
элемента comment говорит о

том, что он не
обязательно будет присутствовать в составе
элемента PurchaseOrderType.
Вообще, элемент является обязательным,
если значение minOccurs больше или равно 1.
Максимальное число появлений элемента
определяется значением, задаваемым параметром maxOccurs.
Это значение может быть положительным целым числом, или термом unbounded, что означает отсутствие ограничения максимального числа появлений.
Значение по умолчанию для minOccurs и для maxOccurs равно 1.
Слайд 71

Атрибуты, в отличие от элементов, могут появиться только однажды или ни

Атрибуты, в отличие от элементов, могут появиться только однажды или ни

разу.
В частности атрибуты могут быть объявлены с параметром use.
В зависимости от значения этого параметра атрибут
обязателен (use="required"),
необязателен (use="optional"),
запрещен (use="prohibited").
Значения по умолчанию и атрибутов и элементов могут быть объявлены с использованием параметра default, хотя этот параметр в том или ином случае работает по разному.
Атрибут со значением, определенным по умолчанию, может появляться или не появляться в xml документе.
Если атрибут не появляется в документе, то обработчик схемы обеспечивает, атрибут со значением равным значению default.
Слайд 72

Значение по умолчанию для элементов обрабатывается немного по-другому. Если элемент появляется

Значение по умолчанию для элементов обрабатывается немного по-другому.
Если элемент появляется

в документе, но не содержит какого либо значения, то в качестве его значения подставляется значение по умолчанию.
Атрибут fixed используется в объявлениях и атрибутов и элементов.
Он используется, чтобы указать, что атрибут или элемент могут принимать фиксированные значения.
Слайд 73

Простые типы Язык XML-схемы имеет довольно обширный набор простых типов. Новые

Простые типы
Язык XML-схемы имеет довольно обширный набор простых типов.
Новые простые

типы можно определить, получая их от существующих простых типов (встроенных или ранее определенных).
В частности можно получить новый простой тип, ограничивая существующий простой тип.
Другими словами, для нового типа можно установить собственный диапазон значений как подмножество диапазона значений существующего типа.
Слайд 74

Рассмотрим пример, создадим новый простой тип myInteger: Чтобы определить тип myInteger,

Рассмотрим пример, создадим новый простой тип myInteger:

value="10000"/>


Чтобы определить тип myInteger, ограничивается диапазон базового типа integer, используя два фасета, названные minInclusive и maxInclusive.
Слайд 75

Возможно использование и других комбинаций встроенных простых типов и фасетов. Рассмотрим

Возможно использование и других комбинаций встроенных простых типов и фасетов.
Рассмотрим более

сложный пример определения простого типа.
Тип по имени SKU получен из простого типа string. Значения SKU ограничивается путем использования фасета pattern, который содержит регулярное выражение, определяющее допустимый формат строки "\d{3}-[A-Z]{2}".
Слайд 76

Язык XML-схем определяет пятнадцать фасетов. Среди них особенно полезен фасет enumeration.






Язык

XML-схем определяет пятнадцать фасетов.
Среди них особенно полезен фасет enumeration. Его можно использовать для ограничения значения почти каждого простого типа, кроме boolean.
Фасет enumeration ограничивает простой тип набором явных значений.
Слайд 77

Рассмотрим пример:

Рассмотрим пример:





Слайд 78

Тип List В дополнение к так называемым атомарным типам, которые составляют

Тип List
В дополнение к так называемым атомарным типам, которые составляют

большинство, XML-схема имеет понятие списка.
Списочные типы состоят из последовательностей атомарных типов, и, следовательно, допустимыми значениями могут быть только "атомы" из этой последовательности.
Например, списочный тип NMTOKENS состоит из значений типа NMTOKEN, разделенных пробелами.
Слайд 79

В дополнение к встроенным списочным типам можно создать новые списочные типы

В дополнение к встроенным списочным типам можно создать новые списочные типы

из существующих атомарных типов.
Невозможно создать списочные типы из существующих списочных типов или из комплексных типов.
Рассмотрим пример создания списочного типа:



Элемент в документе, содержимое которого соответствует типу listOfMyIntType, может выглядеть следующим образом:
20003 15037 95977 95945
Слайд 80

Для создания списочного типа могут быть применены следующие фасеты: length, minLength,

Для создания списочного типа могут быть применены следующие фасеты: length, minLength,

maxLength, и enumeration.
Например, чтобы определить список точно из шести штатов США (SixUSStates), необходимо сначала определить новый списочный тип (полученный из типа USState) с именем USStateList, а затем создать тип SixUSStates, ограничивая USStateList только шестью элементами.
Списочный тип SixUSStates:
Слайд 81

Элементы, тип которых - SixUSStates, должны содержать шесть элементов, и каждый






value="6"/>


Элементы, тип которых - SixUSStates, должны содержать шесть элементов, и каждый из этих шести элементов должен быть одним из атомарных значений перечислимого типа USState, например:
PA NY CA NY LA AK
Слайд 82

Тип Union Атомарные типы и списочные типы дают возможность элементу или

Тип Union
Атомарные типы и списочные типы дают возможность элементу или атрибуту

принимать значение (одно или более) экземпляра одного атомарного типа.
Тип Union дает возможность элементу или атрибуту принимать значение (одно или более) одного типа, образованного путем объединения множества атомарных и списочных типов.
Например, создадим union-тип для идентификации штатов США как односимвольного сокращения названия или списка числовых кодов.
Слайд 83

memberTypes="USState listOfMyIntType"/> Атрибут memberTypes оператора union задает список всех типов в


memberTypes="USState listOfMyIntType"/>

Атрибут memberTypes оператора

union задает список всех типов в объединении.
Предположим, что был объявлен элемент с названием zips типа zipUnion, тогда он может принимать следующие значения:
CA
95630 95977 95945
AK
Слайд 84

Определение анонимных типов При создании схем применяется два стиля. Схемы могут

Определение анонимных типов
При создании схем применяется два стиля.
Схемы могут создаваться

путем определения поименованных типов (например, PurchaseOrderType) с последующим объявлением элементов этого типа (например, purchaseOrder).
При этом объявленные элементы ссылаются на поименованный тип с помощью конструкции type= .
Этот стиль является достаточно простым, но может стать неуправляемым, особенно если определяется много типов, на которые ссылаются только один раз, и которые содержат немного ограничений.
В этих случаях, тип может быть более кратко определен как анонимный.
Слайд 85

Анонимный тип нет необходимости именовать и, следовательно, задавать на него ссылки.

Анонимный тип нет необходимости именовать и, следовательно, задавать на него ссылки.
Определение

типа Items в po.xsd содержит два объявления item и quantity, использующие анонимный тип.
Комплексные типы из простых типов
Рассмотрим вопрос как задать определение комплексного типа, который основан на простом типе, например, decimal ?
Очевидно, необходимо получить новый комплексный тип из простого типа decimal.
Рассмотрим пример:
Слайд 86










Слайд 87

Для того чтобы начать описание нового анонимного типа, используется элемент complexType.

Для того чтобы начать описание нового анонимного типа, используется элемент complexType.


Чтобы указать, что новый тип содержит только символьные данные и не содержит подэлементов, используется элемент simpleContent.
Наконец, получаем новый тип, расширяя простой тип decimal.
Расширение типа decimal заключается в добавлении (путем использования стандартного объявления) атрибута currency.
Слайд 88

Смешанное содержимое Рассмотрим вариант размещения символьных данных в любом элементе. Пример:

Смешанное содержимое
Рассмотрим вариант размещения символьных данных в любом элементе. Пример:

Dear Mr.
Robert Smith .
Your order of
1

Baby Monitor

shipped from our warehouse on
1999-05-21. ....

Слайд 89

Текст появляется между элементами salutation, quantity, productName и shipDate, которые являются

Текст появляется между элементами salutation, quantity, productName и shipDate, которые являются

дочерними элементами letterBody.
Рассмотрим схему для документа letterBody.

















Слайд 90

Элементы, появляющиеся в письме клиенту объявлены, и их типы определены, с

Элементы, появляющиеся в письме клиенту объявлены, и их типы определены, с

помощью операторов element и complexType.
Чтобы разрешить символьным данным появиться между дочерними элементами letterBody, атрибут mixed в операторе определения типа равен true.
Пустое содержимое
Предположим, что элемент internationalPrice будет задавать наименование валюты и цену как значения атрибутов, а не как значение атрибута и содержимого элемента.
Например:

Слайд 91

Такой элемент вообще не имеет никакого содержания. Чтобы определить тип, содержание

Такой элемент вообще не имеет никакого содержания. Чтобы определить тип, содержание

которого пусто, необходимо определить тип, который позволяет включать в его состав только подэлементы, но при этом не объявлять никаких элементов.
xsd схема для такого элемента имеет вид:
Слайд 92










Слайд 93

В этом примере, определяется анонимный тип с помощью оператора complexContent, то

В этом примере, определяется анонимный тип с помощью оператора complexContent, то

есть предполагается, что он будет содержать только элементы.
Оператор complexContent говорит о том, что модель комплексного типа будет ограничиваться или расширяться, а элемент restriction с параметром anyType объявляет два атрибута, но не задает никакого содержания элемента.
Предыдущий синтаксис для объявления пустого элемента является относительно подробным.
Элемент internationalPrice можно объявить короче.
Слайд 94

Этот компактный синтаксис работает потому, что комплексный тип, определенный как simpleContent






Этот компактный синтаксис работает потому, что комплексный тип, определенный как simpleContent или complexContent интерпретируется как упрощенное описание комплексного типа, который по умолчанию ограничивается параметром anyType.
Слайд 95

anyType anyType представляет абстракцию, которая является базовым типом прародителем всех простых

anyType
anyType представляет абстракцию, которая является базовым типом прародителем всех простых и

комплексных типов.
Тип anyType не ограничивает как-либо свое содержимое.
Тип anyType используется подобно другим типам, например:

Содержание элемента, объявленного этим способом никак не ограничивается.
Фактически, anyType - это тип, задаваемый по умолчанию.
Так что вышеуказанное объявление может выглядеть следующим образом:

Слайд 96

Аннотации Язык XML-схемы обеспечивает несколько элементов предназначенных для аннотации схемы. Содержимое

Аннотации
Язык XML-схемы обеспечивает несколько элементов предназначенных для аннотации схемы.
Содержимое этих

элементов предназначено как для чтения человеком, так и для чтения приложением.
Элемент documentation предназначен для размещения информации для чтения документа человеком.
Для указания языка комментариев следует использовать атрибут xml:lang со всеми элементами documentation.
Слайд 97

Элемент appInfo, может использоваться, чтобы предоставить информацию для инструментальных средств, таблиц

Элемент appInfo, может использоваться, чтобы предоставить информацию для инструментальных средств, таблиц

стилей и других приложений.
Элемент annotation обычно размещают в начале большинства схем.
Создание моделей содержимого
Все определения комплексных типов представляют собой последовательность объявлений элементов, которые должны появиться в документе-образце.
XML-схема также может обеспечить ограничения вхождения группы элементов в данную модель содержимого.
Слайд 98

XML-схема позволяет определить поименованную группу элементов, которые могут использоваться в моделях

XML-схема позволяет определить поименованную группу элементов, которые могут использоваться в моделях

содержимого комплексного типа.
Также может быть определена непоименованная группа элементов, которые вместе с элементами из поименованной группы будут появляться в документе в той же самой последовательности, в которой были объявлены.
Вместе с тем, группы также могут быть спроектированы таким образом, что только один из элементов группы может появиться в документе-образце.
Слайд 99

Для иллюстрации вышесказанного в определение PurchaseOrderType из схемы заказа на покупку

Для иллюстрации вышесказанного в определение PurchaseOrderType из схемы заказа на покупку

введем две группы, так что заказ сможет содержать либо специальные элементы для указания адреса отправителя и продавца, либо адрес и отправителя и продавца будут задаваться одним и тем же элементом.
Тогда имеем:
Слайд 100

type="USAddress"/>





type="USAddress"/>






Слайд 101

Элемент выбора в группе choice обеспечивает правило, по которому в документе-образце







Элемент выбора в группе choice обеспечивает правило, по которому в документе-образце может появиться только один из его дочерних элементов.
Элемент choice имеет двух потомков.
Один из его потомков - элемент group, который ссылается на поименованную группу shipAndBill, и состоит из последовательности элементов shipTo, billTo.
Второй потомок - singleUSAddress.
Слайд 102

Для ограничения появления элементов в группе существует еще одна возможность. Предположим,

Для ограничения появления элементов в группе существует еще одна возможность.
Предположим, что

все элементы группы должны появиться один раз или не должны появиться ни разу, причем появляться они могут в произвольном порядке.
Групповой элемент all ограничивает модель содержимого сверху.
Кроме того, все дочерние элементы группы должны быть индивидуальными элементами (не группами), и все элементы должны появиться не более одного раза.
То есть это соответствует значениям minOccurs = 0 и maxOccurs = 1.
Слайд 103




ref="comment" minOccurs="0"/>




Слайд 104

В соответствии с этим определением элемент comment может появиться в любом

В соответствии с этим определением элемент comment может появиться в любом

месте purchaseOrder, причем как до, так и после элементов shipTo, billTo или Items.
Но при этом он может появиться только однажды.
Кроме того соглашения группы all не позволяют объявлять элементы вроде comment вне группы, что ограничивает возможность его использования для многократного появления.
Слайд 105

Группы атрибутов Предположим, что необходимо обеспечить подробную информацию о каждом продукте

Группы атрибутов
Предположим, что необходимо обеспечить подробную информацию о каждом продукте в

заказе на закупку.
Например, вес каждого продукта и предпочтительный вариант отгрузки.
Этого можно достигнуть, добавив к определению типа item (анонимному) объявления атрибутов weightKg и shipBy.
Рассмотрим пример:
Слайд 106

………………………………………..

………………………………………..





value="land"/>




Слайд 107

Вместо этого можно создать поименованную группу атрибутов, содержащую все желательные атрибуты

Вместо этого можно создать поименованную группу атрибутов, содержащую все желательные атрибуты

элемента item, и в объявлении item сделать ссылку на эту группу.
…………………………………………….

………………………………………………













Слайд 108

Значения Nil Один из объектов в заказе на закупку, перечисленных в

Значения Nil
Один из объектов в заказе на закупку, перечисленных в

po.xml, Lawnmower, не имеет элемента shipDate.
Но вообще, отсутствие элемента не дает какой-либо определенной информации.
Это может указывать на то, что информация отсутствует, или не соответствует действительности, или элемент может отсутствовать по другой причине.
Иногда желательно представить не отгруженное изделие, неизвестную или неподходящую информацию явно с помощью элемента, а не отсутствующим элементом.
Слайд 109

Для индикации возможности пустого значения элемента Nil-механизм XML-схемы использует специальный признак.

Для индикации возможности пустого значения элемента Nil-механизм XML-схемы использует специальный признак.


Другими словами, возможное пустое значение элемента обозначается не с помощью какого-либо специального Nil-значения содержимого, а с помощью специального атрибута, показывающего возможность пустого значение элемента.
Рассмотрим пример:
nillable="true"/>