Представление символьной информации. ASCII

Содержание

Слайд 2

Варианты манчестерского кодирования Вариант №1 (по Д.Е. Томасу): логический ноль кодируется

Варианты манчестерского кодирования

Вариант №1 (по Д.Е. Томасу): логический ноль кодируется перепадом

напряжения с низкого уровня на верхний уровень, а логическая единица кодируется перепадом напряжения с верхнего уровня на нижний.
Вариант №2 : логический ноль кодируется перепадом напряжения с верхнего уровня на нижний, а логическая единица кодируется перепадом напряжения с низкого уровня на верхний уровень.
Вариант №3 (дифференциальное манчестерское кодирование, разностное манчестерское кодирование): логический ноль кодируется изменением состояния в начале значащего интервала, а логическая единица кодируется сохранением предыдущего уровня.
Слайд 3

Память 8 бит – 1 байт 1 кбайт – 1024 байт

Память

8 бит – 1 байт 1 кбайт – 1024 байт
1 мбайт

– 1024 кбайт
1 гбайт – 1024 мбайт
Слайд 4

Кодируемые символы Буквенно-цифровые знаки алфавитов. Специальные знаки: пробел, скобки, знаки препинания,

Кодируемые символы

Буквенно-цифровые знаки алфавитов.
Специальные знаки: пробел, скобки, знаки препинания, знаки операций

и т.д.
Управляющие символы.

Наиболее распространенные способы кодирования символов

Использование кодировочной таблицы ASCII.
Использование стандарта кодирования символов Unicode.

Слайд 5

ASCII ASCII – American Standard Code for Information Interchange (американский стандартный

ASCII

ASCII – American Standard Code for Information Interchange (американский стандартный код

обмена информацией
Введен в действие институтом стандартизации США (ANSI – American National Standard Institute) в 1963 году.
Первоначально предполагалось использование 7 бит кода.
Слайд 6

Таблица ASCII

Таблица ASCII

Слайд 7

Слайд 8

Кодовая таблица ASCII Кодовая таблица ASCII состоит из двух частей: Базовая

Кодовая таблица ASCII

Кодовая таблица ASCII состоит из двух частей:
Базовая таблица
Расширенная таблица

Совокупность

символов базовой и расширенной таблицы определяет кодировку.
Слайд 9

Базовая таблица Коды 00h – 7Fh

Базовая таблица

Коды 00h – 7Fh

Слайд 10

Расширенная таблица (ASCII) Коды 80h – FFh

Расширенная таблица (ASCII)

Коды 80h – FFh

Слайд 11

КОИ-8R Windows-1251 (CP 1251)

КОИ-8R

Windows-1251 (CP 1251)

Слайд 12

Пример неправильно выбранной кодировки Windows-1251 (CP 1251) КОИ-8R

Пример неправильно выбранной кодировки

Windows-1251 (CP 1251)

КОИ-8R

Слайд 13

Управляющие ASCII символы Некоторые управляющие символы: TAB, 09 - табуляция LF,

Управляющие ASCII символы

Некоторые управляющие символы:
TAB, 09 - табуляция
LF, 0A  - перевод

строки
CR, 0D - возврат каретки
CR LF
Слайд 14

Псевдографика Для оформления программ и документов в текстовом режиме, используются псевдографические символы.

Псевдографика

Для оформления программ и документов в текстовом режиме, используются псевдографические символы.

Слайд 15

Псевдографика (ASCII)

Псевдографика (ASCII)

Слайд 16

Unicode Unicode – стандарт кодирования символов. Коду символа сопоставляется некоторое положительное

Unicode

Unicode – стандарт кодирования символов.
Коду символа сопоставляется некоторое положительное целое число.
Для

представления кода в компьютере используются форматы представления (UTF – Unicode transformation format): UTF-8, UTF-16, UTF-32
По стандарту Unicode первые 128 символов соответствуют ASCII.
Слайд 17

Unicode В первых версиях стандарта код символа представлялся двухбайтовым словом 8

Unicode

В первых версиях стандарта код символа представлялся двухбайтовым словом

8

8

В настоящее время

стандарт Unicode обеспечивает кодирование 1 112 064 символов.
Слайд 18

UTF-8 8-битный формат преобразования Unicode Обеспечивает совместимость с ASCII. Длина кода

UTF-8

8-битный формат преобразования Unicode
Обеспечивает совместимость с ASCII.
Длина кода нефиксированная – от

1 до 4 байт
Слайд 19

Пример декодирования символа для UTF-8 1 1 0 1 0 0

Пример декодирования символа для UTF-8

1

1

0

1

0

0

0

0

1

0

0

1

0

0

0

0

1

0

0

0

0

0

1

0

0

0

0

0

1

4

0410

Слайд 20

Кириллическая таблица Unicode D0 BB D0 B5 D1 81

Кириллическая таблица Unicode

D0 BB D0 B5 D1 81

Слайд 21

BOM Byte Order Mark – сигнатура, определяющая UTF. UTF-8 EF BB

BOM

Byte Order Mark – сигнатура, определяющая UTF.
UTF-8
EF BB BF
UTF-16BE
FE FF
UTF-16LE
FF FE
UTF-32BE
00

00 FE FF
UTF-32LE
FF FE 00 00