Кодирование информации. Зачем кодировать информацию?

Содержание

Слайд 2

Зачем кодировать информацию? Кодирование — это представление информации в форме, удобной

Зачем кодировать информацию?

Кодирование — это представление информации в форме, удобной для

её хранения, передачи и обработки.

В компьютерах используется двоичный код:

10101001010

данные (код)

передача

11111100010

данные (код)

хранение

передача

кодирование

обработка

Слайд 3

Кодирование символов 100000 101000 011101 111100 Общий подход: нужно использовать N

Кодирование символов

100000

101000

011101

111100

Общий подход:
нужно использовать N символов
выберем число битов k на символ:

2k ≥ N
сопоставим каждому символу код – число от 0 до 2k – 1
переведем коды в двоичную систему

Система Брайля:

Слайд 4

Кодирование символов Текстовый файл на экране (символы) в памяти – коды

Кодирование символов

Текстовый файл

на экране (символы)
в памяти – коды

Файлы со шрифтами: *.fon,

*.ttf, *.otf
Слайд 5

Кодировка ASCII (7-битная) ASCII = American Standard Code for Information Interchange

Кодировка ASCII (7-битная)

ASCII = American Standard Code for Information Interchange
Коды 0-127:
0-31

управляющие символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc.
32 пробел
знаки препинания: . , : ; ! ?
специальные знаки: + - * / () {} []
48-57 цифры 0..9
65-90 заглавные латинские буквы A-Z
97-122 строчные латинские буквы a-z

Не предусмотрены

Слайд 6

8-битные кодировки Кодовые страницы (расширения ASCII): таблица ASCII национальный алфавит Для

8-битные кодировки

Кодовые страницы (расширения ASCII):

таблица ASCII

национальный алфавит

Для русского языка:
CP-866 для MS

DOS
CP-1251 для Windows (Интернет)
КОI8-R для UNIX (Интернет)
MacCyrillic для компьютеров Apple

Проблема:

Слайд 7

8-битные кодировки 1 байт на символ – файлы небольшого размера! просто

8-битные кодировки

1 байт на символ – файлы небольшого размера!
просто обрабатывать в

программах

нельзя использовать символы разных кодовых страниц одновременно (русские и французские буквы, и т.п.)
неясно, в какой кодировке текст (перебор вариантов!)
для каждой кодировки нужен свой шрифт (изображения символов)

Слайд 8

Стандарт UNICODE 1 112 064 знаков, используются около 100 000 Windows:

Стандарт UNICODE

1 112 064 знаков, используются около 100 000

Windows: UTF-16

16 битов

на распространённые символы,
32 бита на редко встречающиеся

Linux: UTF-8

8 битов на символ для ASCII,
от 16 до 48 бита на остальные

совместимость с ASCII
более экономична, чем UTF-16, если много символов ASCII

Слайд 9

Практическая работа №8 Кодирование текстовой информации Задание 1. Используя шифр Цезаря

Практическая работа №8 Кодирование текстовой информации

Задание 1.
Используя шифр Цезаря с шагом

3,закодировать сообщение УТРО ВЕЧЕРА МУДРЕНЕЕ
Шифр Цезаря. Способ кодировки, при котором буква заменяется на другую букву отстоящую от первой на определенный шаг.
Например, если шаг равен 3, то буква А меняется на Г, буква Б – на Д, а буква Ю – на букву Б.
Оформление задания

Задание 2.
Для кодирования сообщения используется таблица
Приведите все варианта декодирования сообщения 0101110010110.
Ответ оформить в виде последовательности букв. Например, АГДБВ