Машинное представление данных

Содержание

Слайд 2

Машинное представление данных Различные структуры данных имеют разное машинное представление, особенно

Машинное представление данных

Различные структуры данных имеют разное машинное представление,
особенно базовые

(простые) структуры,
из которых строятся более сложные конструкции данных.

И+ПРГ

Слайд 3

В языках программирования простые структуры описываются простыми (базовыми) типами. Размер памяти,

В языках программирования простые структуры описываются простыми (базовыми) типами. Размер памяти,

необходимый для данных того или иного типа, может быть разным не только в разных языках программирования, но и в разных реализациях одного и того же языка.

Типовые размеры памяти для простых типов данных

* - дополнительные логические типы данных в Borland Pascal 7

И+ПРГ

Слайд 4

Оперативная память (ОП) ПЭВМ состоит из ячеек размером в 1 байт,

Оперативная память (ОП) ПЭВМ состоит из ячеек размером в 1 байт,

каждая ячейка имеет собственный уникальный номер – адрес. Память разделяется на сегменты размером 216 = 65 536 байт или 64 Кб, что определяется архитектурой микропроцессоров 80х86 (16-разрядных). [32-х и 64-х-разрядная адресация поддерживается в операционных системах Windows и UNIX / Linux.]
Адрес каждого байта ОП формируется из двух слов (каждое размером по 16 бит – по 2 байта) – адреса сегмента и смещения (смещение указывает на сколько байт от начала сегмента сдвинут адрес конкретного байта).
Адрес байта формируется следующим образом: адрес сегмента смещается на 4-е двоичных разряда (бита) влево и к нему прибавляется смещение, таком образом физический адрес байта составляет 20 бит и с его помощью можно адресовать 220 байт (1 Мбайт):

Сегмент
+
Смещение
=
Адрес

16+4 бит
16 бит
20 бит

Адрес сегмента

Смещение

Физический адрес

Указатель занимает в памяти 4 байта (32 бита) и адресует первый байт данных, например, первый байт первого элемента массива.

Указатель занимает в памяти 4 байта (32 бита) хотя собственная длина указателя – 20 бит и он помещается в 3 байта, НО обычно память выделяется словами по 2 байта (16 бит) и выравнивается на границу слова – т.е под указатель выделяется 2 слова (а не 1,5).

И+ПРГ

Слайд 5

Машинное представление байта В байте со знаком, для пред-ставления числа можно

Машинное представление байта

В байте со знаком, для пред-ставления числа можно ис-пользовать

не 8, а только 7 бит (разрядов). Восьмой же бит является знаковым (S – sign), т.е. индицирует знак хранимого в байте числа; 1 в этом разряде, обычно, соответствует отрица-тельному числу, а 0 – положи-тельному.

Пример: для числа -33 в формате integer:
1000000000100001 - прямой код
0111111111011110 - обратный код
+______________1
1111111111011111 - дополнительный код

Операции с таким представлением наглядны, но не экономичны. Для оперирования со знаком числа требуется выполнять специальные алгоритмы операции, а это затраты машинного времени.

Более экономным является представление отрицательных чисел в дополнительном коде, который формируется следующим образом:
⬥ модуль отрицательного числа записать в прямом коде, в неиспользуемые старшие биты записать нули;
⬥ сформировать обратный код числа, для этого нуль заменить единицей, а единицу заменить нулем;
⬥ к обратному коду числа прибавить единицу;
⬥ знаковый (старший) разряд числа сделать равным 1.

Для положительных чисел прямой, обратный и дополнительный коды одинаковы, при этом знаковый (старший) разряд равен 0. Аналогично представляются целые числа других типов.

Машинное представление данных

И+ПРГ

Слайд 6

Тот же принцип дополнительного кода для отрицательных чисел можно использовать и

Тот же принцип дополнительного кода для отрицательных чисел можно использовать и

в компьютерном представлении шестнадцатеричных (десятичных) чисел: для каждого разряда цифра X заменяется на 15-X (9-X), и к получившемуся числу добавляется 1.
Примеры:
Десятичные числа – при использовании четырёхзначных чисел -0081 заменяется на 9919 (9919+0081=0000, пятый разряд отбрасывается),
16-ричные числа в дополнительном коде – 7F3C - прямой код
80С3 - обратный код
+1
80С4 – дополнительный код

Дополнительный код позволяет свести операцию вычитания к сложению положительного числа в прямом коде и отрицательного в обратном.
Пример: Сложим +1 и -1:
00000001 - в прямом двоичном коде
11111111 - в дополнительном коде
00000000 - перенос разряда дает в результате +1-1=0
(левый разряд переполнения – отбрасывается)

Для отображения шестнадцатеричных чисел (в частности, в редакторе Total Commander и в других редакторах, например, FAR) используются восемь двоичных разрядов байта разбитые на две группы по четыре бита. Четырьмя разрядами двоичной системы счисления представляется одна цифра шестнадцатеричной системы счисления.
В шестнадцатеричной системе счисления число представляется в виде суммы степеней числа 16. Для изображения числа используется шестнадцать цифр: десять обычных десятичных цифр {0,1,2,3,4,5,6,7,8,9} и шесть латинских заглавных букв {A,B,C,D,E,F}.
Таким образом содержимое байта отображают двузначным числом в шестнадцатеричной системе счисления (младший разряд – справа).
Например, 0110 11012 = 6D16
1010 00102 = A216

Машинное представление данных

И+ПРГ

Слайд 7

Машинное представление совокупности байт Машинное представление данных В процессорах Intel слова

Машинное представление совокупности байт

Машинное представление данных

В процессорах Intel слова хранятся в

памяти начиная с младшего байта, и за адрес слова принимается адрес младшего байта. То есть короткое слово 53C6 в памяти хранится так: С6, 53. А длинное слово 14AFB820 так: 20, B8, AF, 14. Т.е. младший байт числа – слева, а младший разряд в байте – справа.

В 16-разрядных процессорах слово состоит из 2-х байт. В 32- разрядных процессорах слово состоит из 4-х байт. Двойное слово, как и следует из названия, содержит ровно в два раза больше байт, чем просто слово. Как же называют набор из двух байт для 32-разрядного процессора? На больших ЭВМ - это полуслово. А на процессоре Intel 80х86 (младшие модели этих процессоров были 16-разрядными, а начиная с 80386 стали 32-разрядными) фирма Intel сохранила термино-логию 16-разрядных моделей. В официальной документации на процессоры Intel словом, или коротким словом, называется набор из 2 байт, то есть 16 разрядов. Это верно даже для Pentium. Набор из 4 байт, или 32 разряда, называется двойным словом, или длинным словом. Это сделано для единства терминологии, независимо от конкретной модели ПЭВМ.

Младший байт Старший байт

Короткое слово

Длинное (двойное) слово

И+ПРГ

Слайд 8

Целые числовые типы данных shortint – переменная хранится как байт со

Целые числовые типы данных

shortint – переменная хранится как байт со знаком


integer – переменная хранится как слово (2 байта) со знаком

longint – переменная хранится как двойное слово (4 байта) со знаком

. . .

comp – Сложный тип (содержит только целочисленные значения в диапазоне от -263+1 до +263-1), хранится как два двойных слова (8 байт) со знаком

. . .

byte – переменная хранится как байт без знака

word – переменная хранится как слово (2 байта) без знака

int, signed [int], short [int] – переменная хранится как слово (2 байта) со знаком

unsigned [int], unsigned short [int] – переменная хранится как слово (2 байта) без знака

long [int], signed long [int] – переменная хранится как двойное слово (4 байта) со знаком

. . .

unsigned long [int] – переменная хранится как двойное слово (4 байта) без знака

. . .

И+ПРГ

Слайд 9

Логические типы данных boolean – переменная хранится как байт без знака

Логические типы данных

boolean – переменная хранится как байт без знака

char

– переменная хранится как байт без знака

byte – переменная хранится как байт без знака

word – переменная хранится как слово (2 байта) без знака

bool – переменная хранится как байт без знака

char, signed char – переменная хранится как байт со знаком

unsigned char – переменная хранится как байт без знака

wchar_t – переменная хранится как слово (2 байта) без знака

Символьные типы данных

Битовые типы данных

enum – переменная хранится как тип int (2 байта) без знака

Перечисляемый тип данных

(,,,) – переменная хранится как байт без знака (в нём содержится порядковый номер присваиваемого значения)

Интервальный тип данных

[..] – переменная хранится как 1, 2 или 4 байта без знака, в зависимости от того каким целочисленным типом данных описаны границы интервала

Указатели

Тип указателя – это адрес ячейки памяти. В среде MS DOS адрес имеет размер 20 двоичных разрядов (бит).

И+ПРГ

Слайд 10

Машинное представление данных Формат машинного представления вещественных чисел Система вещественных чисел,

Машинное представление данных

Формат машинного представления вещественных чисел

Система вещественных чисел, применяемая при

ручных вычислениях, предполагается бесконечно непрерывной. Это означает, что не существует никаких ограничений на диапазон используемых чисел и точность их представления. Для любого вещественного числа имеется бесконечно много чисел, которые больше или меньше его, а между любыми двумя вещественными числами также находится бесконечно много вещественных чисел.
Реализовать такую систему в технических устройствах невозможно. Во всех компьютерах размеры ячеек памяти фиксированы, что ограничивает систему представимых чисел. Ограничения касаются как диапазона, так и точности представления чисел, т.е. система машинных чисел оказывается конечной и и дискретной, образуя подмножество системы вещественных чисел.
Отсюда, в отличии от порядковых типов (все целые, символьный, логический), значения которых всегда сопоставляются с рядом целых чисел и, следовательно, представляются в памяти машины абсолютно точно, значение вещественных типов определяет число лишь с некоторой конечной точностью, зависящей от внутреннего формата вещественного числа.

Для вещественных чисел по стандарту ANSI/IEEE 754-1985 (IEEE Standard for Binary Floating-Point Arithmetic’s) используется нормализованное представление со смещенным порядком. То есть число приводится к виду:
A = ±M · 2±P, ½ <= M < 1,
где M – мантисса, P – порядок. (Нормализованная запись отличного от нуля действительного числа – это запись вида a = m*Qp, где p – целое число (положительное, отрицательное или ноль), а m – правильная Q-ричная дробь, у которой первая цифра после запятой не равна нулю, то есть 1/Q <= m <1). Так как в результате старший разряд целой части двоичного числа всегда равен единице, его обычно в памяти не хранят («скрытый бит» или «скрытая единица»). Порядок хранится в смещенном коде («модифицированный порядок» или «характеристика»): P' = P+2n-1, где n – число разрядов машинного представления порядка. Это делается для того, чтобы характеристика всегда была положительной. Для представления нуля обнуляются все биты мантиссы и порядка.
Объясним ИНАЧЕ: Старший разряд двоичного представления вещественного числа всегда кодирует знак числа. Остальная часть разбивается на две части: мантиссу и экспоненту. Вещественное число имеет вид:
A = ±S · M · 2E,
где S - знаковый бит числа, E - экспонента, M - мантисса. Если 1/2≤M<1, то такое число называется нормализованным. При хранении нормализованных чисел сопроцессор отбрасывает целую часть мантиссы (она всегда 1), сохраняя лишь дробную часть. Экспонента кодируется со сдвигом на половину разрядной сетки, таким образом, удается избежать вопроса о кодировании знака экспоненты. Т.е. при 8-битной разрядности экспоненты код 0 соответствует числу -127, 1 - числу -126, ..., 255 числу +126 (экспонента вычисляется как код 127).

И+ПРГ

Слайд 11

Машинное представление данных Формат машинного представления вещественных чисел Пример: кодирование числа

Машинное представление данных

Формат машинного представления вещественных чисел

Пример: кодирование числа 178,625 в

соответствии с IEEE-754.
178,62510 = 128 + 32 + 16 + 2 + 0,5 + 0,125 =
1·27 + 0·26 + 1·25 + 1·24 + 0·23 + 0·22 + 1·21 + 0·20 + + 1·2-1 + 0·2-2 + 1·2-3 = 10110010,1012
Его нужно нормализовать (привести в экспоненциальный вид):
1,78625E102 = 1,0110010101E2111
В формате вещественного числа одинарной точности оно будет представлено так:

Стандарт IEEE-754 определяет три основных способа кодирования (типа) вещественных чисел:

И+ПРГ

Слайд 12

Вещественные числовые типы данных single real double extended float double long

Вещественные числовые
типы данных

single

real

double

extended

float

double

long double

i – позиция неявной двоичной точки

i

– позиция неявной двоичной точки

1 –целочисленный бит мантиссы
(явный в long и неявный во float и double)

Алгоритм формирования машинного представления вещественного числа в памяти ЭВМ
1) Число представляется в двоичном коде.
2) Двоичное число нормализуется. При этом для чисел, больших единицы, плавающая точка переносится влево, определяя положительный порядок. Для чисел, меньших единицы, точка переносится вправо, определяя отрицательный порядок.
3) Затем с учетом типа вещественного числа определяется характеристика.
4) В отведенное поле памяти (в соответствии с типом числа) записываются мантисса, характеристика и знак числа. При этом необходимо отметить следующее:
(а) для чисел типа real характеристика хранится в младшем байте памяти, для чисел типа single, float, double, extended, long double - в старших байтах; (б) знак числа находится всегда в старшем бите старшего байта;
(в) мантисса всегда хранится в прямом коде; (г) целая часть мантиссы (для нормализованного числа всегда равна 1) для чисел типа single, real, float, double не хранится (является скрытой). В числах типа extended, long double все разряды мантиссы хранятся в памяти ЭВМ.

И+ПРГ

Слайд 13

Практическое занятие: Анализ машинных форматов на примере типизированных файлов Pascal Задание:

Практическое занятие:

Анализ машинных форматов на примере типизированных файлов Pascal

Задание:
Вывести

в файл datatype.dtp заданные преподавателем целые и символьные данные и просматри-вая их на экране в 16-ричном виде определить где какое число и символ (смотреть 16-ричное значение в редакторах FAR или Total Commander).
Запустить отладчик Borland Pascal, посмотреть в нём адреса вводимых переменных и определить сколько памяти отводится под каждое значение.

Program DataType;
type
StructInt = record
ii : integer; si : shortint; li : longint;
ch : char;
by : byte;
end;
var
f : file of StructInt ; (* типизированный файл *)
St : StructInt;
begin
assign (f, 'z:\datatype.dtp'); (* Создание файла *)
rewrite (f); (*Открыть файл в режиме перезаписи*)
write ('Введите целое число со знаком и
нажмите Enter ->'); readln (St.ii);
write ('Введите короткое целое со знаком и
нажмите Enter ->'); readln (st.si);
write (' ведите длинное целое со знаком и
нажмите Enter ->'); readln (st.li);
write ('Введите символ (букву) и
нажмите Enter ->');
readln (st.ch);
write (' Введите целое число без знака и
нажмите Enter ->'); readln (st.by);
write (f, st); (*запись считанной структуры в файл*)
close (f); (* закрыть файл *)
writeln ('Введенные числа и символ записаны в
файл ', 'z:\datatype.dtp');
readln;
end.

И+ПРГ