Кодирование текстовой информации. Ключевые слова

Август 21, 2022

Главная
Информатика
Кодирование текстовой информации. Ключевые слова

Содержание

2. Ключевые слова текстовая информация кодирование кодовые таблицы
3. … 64 65 66 67 68 … 01000000 01000001 01000010 01000011 01000100 Компьютерное представление текстовой информации
4. Кодировка ASCII American Standard Code for Information Interchange – американский стандартный код для обмена информацией, разработанный
5. Расширение кодировки ASCII Стандартная часть кода (0 … 127) Расширение ASCII (128 … 255) (буквы национального
6. Расширение кодировки ASCII
7. Стандарт Unicode Unicode — это «уникальный код для любого символа, независимо от платформы, независимо от программы,
8. Клавиатуры некоторых стран мира
9. Кодировки стандарта Unicode Для представления символов в памяти компьютера в стандарте Unicode имеется несколько кодировок. Кодировка
10. Информационный объем сообщения Информационным объёмом текстового сообще-ния называется количество бит (байт, килобайт, мегабайт и т. д.),
11. Вопросы и задания В Советском энциклопедическом словаре (1983 года издания) 1600 страниц. На одной странице размещается
12. Самое главное Текстовая информация по своей природе дискретна, так как представляется последовательностью отдельных символов. В памяти
13. Самое главное В 1991 году был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод), позволяющий
14. Вопросы и задания Задание 1. Представьте в кодировке ASCII текст Happy New Year! а) шестнадцатеричным кодом
15. Windows-1251 Подходы к расположению русских букв в различных кодировках Задание 2. Сравните подходы к расположению русских
16. Вопросы и задания Задание 3. В 15-м издании энциклопедии Britannica 32 тома, в каждом из которых
18. Скачать презентацию

Слайд 2

Ключевые слова
текстовая информация
кодирование
кодовые таблицы

Слайд 3

…
64
65
66
67
68
…
01000000
01000001
01000010
01000011
01000100
Компьютерное представление текстовой информации
Для компьютерного представления текстовой информации достаточно:

Слайд 4

Кодировка ASCII
American Standard Code for Information Interchange – американский стандартный код

для обмена информацией, разработанный в 1960-х годах в США.

Первые 32 символа и 128-й – управляющие
(при выводе текста они не отображаются графически)

Изображаемые символы
(буквы латинского алфавита, цифры, знаки препинания и арифметических операций, скобки и некоторые специальные символы)

Слайд 5

Расширение кодировки ASCII
Стандартная часть кода (0 … 127)
Расширение ASCII (128 …

255)
(буквы национального алфавита, символы национальной валюты и т.п.)

Слайд 6

Расширение кодировки ASCII

Слайд 7

Стандарт Unicode
Unicode — это «уникальный код для любого символа, независимо от

платформы, независимо от программы, независимо от языка» (www.unicode.org).

Стандарт Unicode был разработан в 1991 году и описывает алфавиты всех извест-ных, в том числе и «мертвых», языков. Для языков, имеющих несколько алфавитов или вариантов написания (японского и индийского), закодированы все варианты.
В кодировку Unicode внесены все матема-тические и иные научные символьные обозначения и даже некоторые придуман-ные языки (язык эльфов из трилогии Дж. Р. Р. Толкина «Властелин колец»).

65536

Слайд 8

Клавиатуры некоторых стран мира

Слайд 9

Кодировки стандарта Unicode
Для представления символов в памяти компьютера в стандарте Unicode

имеется несколько кодировок.

Кодировка UTF-16

Кодировка UTF-8

Часто используемые символы: 2 байта (16 бит)

Редко используемые символы: 4 байта (32 бит)

Символы, входящие
в таблицу ASCII: 1 байт (8 бит)

Символы, не входящие в таблицу ASCII: 2-4 байта (16-32 бит)

Кодировки Unicode позволяют включать в один документ символы самых разных языков, но их использование ведёт к увеличению размеров текстовых файлов.

Слайд 10

Информационный объем сообщения
Информационным объёмом текстового сообще-ния называется количество бит (байт, килобайт,

мегабайт и т. д.), необходимых для записи этого сообщения путём заранее оговоренного способа двоичного кодирования.

Количество символов в сообщении

ASCII, КОИ-8, Windows-1251, …
1 символ = 1 байт

Unicode
1 символ = 2 байта

Слайд 11

Вопросы и задания
В Советском энциклопедическом словаре (1983 года издания) 1600 страниц.

На одной странице размещается в среднем 100 строк по 140 символов (включая пробелы) в каждой. Найдите объем (в Мбайтах) текстовой информации в словаре, если при записи используется кодировка «один символ — один байт».

Дано:
i = 1 байт
K = 1600·100·140

I - ?

I =

Ответ: 21,36 Мбайта

I = K·i

1600·100·140

Мб ≈ 21,36 Мб

Слайд 12

Самое главное
Текстовая информация по своей природе дискретна, так как представляется последовательностью

отдельных символов.
В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.
Основой для компьютерных стандартов кодирования символов послужил код ASCII, рассчитанный на передачу только английского текста. Расширения ASCII-кодировки, в которых первые 128 символов кодовой таблицы совпадают с кодировкой ASCII, а остальные (с 128-го по 255-й) используются для кодирования букв национального алфавита, символов национальной валюты и т. п.

Слайд 13

Самое главное
В 1991 году был разработан новый стандарт кодирования символов, получивший

название Unicode (Юникод), позволяющий использовать в текстах любые символы любых языков мира. Кодировки Unicode позволяют включать в один документ символы самых разных языков, но их использование ведёт к увеличению размеров текстовых файлов.

Слайд 14

Вопросы и задания
Задание 1. Представьте в кодировке ASCII текст
Happy New Year!
а)

шестнадцатеричным кодом
б) десятичным кодом

48 61 70 70 79 20 4E 65 77 20 59 65 61 72 21
72 97 112 112 121 32 78 101 119 32 89 101 97 114 33

ОТВЕТ

Слайд 15

Windows-1251
Подходы к расположению русских букв в различных кодировках
Задание 2. Сравните подходы

к расположению русских букв в кодировках Windows-1251 и КОИ-8.

КОИ-8

p П

r Р

i И

w В

e Е

t Т

ПОДСКАЗКА - 2

ПОДСКАЗКА - 1

Слайд 16

Вопросы и задания
Задание 3. В 15-м издании энциклопедии Britannica 32 тома,

в каждом из которых порядка 1000 страниц. На одной странице размещается в среднем 70 строк по 120 символов (включая пробелы) в каждой. Найдите объем текстовой информации в энциклопедии, если при записи используется кодировка Unicode («один символ — два байта»).

Дано:
i = 2 байта
K = 32·1000·70·120

I - ?

I =

Ответ: 513 Мбайт

I = K·i

32·1000·70·120·2

Мб ≈ 513 Мб

Кодирование текстовой информации. Ключевые слова

Содержание

Ключевые словатекстовая информациякодированиекодовые таблицы

…6465666768…0100000001000001010000100100001101000100Компьютерное представление текстовой информацииДля компьютерного представления текстовой информации достаточно:

Кодировка ASCIIAmerican Standard Code for Information Interchange – американский стандартный код

Расширение кодировки ASCIIСтандартная часть кода (0 … 127)Расширение ASCII (128 …

Расширение кодировки ASCII

Стандарт UnicodeUnicode — это «уникальный код для любого символа, независимо от

Клавиатуры некоторых стран мира

Кодировки стандарта UnicodeДля представления символов в памяти компьютера в стандарте Unicode

Информационный объем сообщенияИнформационным объёмом текстового сообще-ния называется количество бит (байт, килобайт,

Вопросы и заданияВ Советском энциклопедическом словаре (1983 года издания) 1600 страниц.

Самое главноеТекстовая информация по своей природе дискретна, так как представляется последовательностью

Самое главноеВ 1991 году был разработан новый стандарт кодирования символов, получивший

Вопросы и заданияЗадание 1. Представьте в кодировке ASCII текстHappy New Year!а)

Windows-1251Подходы к расположению русских букв в различных кодировкахЗадание 2. Сравните подходы

Вопросы и заданияЗадание 3. В 15-м издании энциклопедии Britannica 32 тома,

Похожие презентации