Кодирование текстовой информации

Содержание

Слайд 2

Кодирование – это процесс представления информации в виде последовательности условных обозначений.

Кодирование – это процесс представления информации в виде последовательности условных обозначений.

Слайд 3

Код – множество слов (последовательностей символов) из некоторого алфавита, используемых при кодировании информации

Код – множество слов (последовательностей символов) из некоторого алфавита, используемых при

кодировании информации
Слайд 4

Письменность – способ кодирования устной речи на естественном языке

Письменность – способ кодирования устной речи на естественном языке

Слайд 5

Устная речь Код: письменный текст Устная речь Декодирование –чтение текста Кодирование

Устная речь

Код: письменный текст

Устная речь

Декодирование –чтение текста

Кодирование –запись текста

СПОСОБ КОДИРОВАНИЯ ЗАВИСИТ

ОТ НАЗНАЧЕНИЯ КОДА

ПРАВИЛО – КАЖДЫЙ СИМВОЛ АЛФАВИТА ИСХОДНОГО ТЕКСТА ЗАМЕНЯЕТСЯ НА КОМБИНАЦИЮ СИМВОЛОВ АЛФАВИТА КОДИРОВАНИЯ

Слайд 6

Телеграфный код ITA2 Буквы знаки символы A R Режим ввода букв

Телеграфный код ITA2

Буквы

знаки

символы

A

R

Режим ввода букв

Слайд 7

Кодировка ASCII (American Standard Code for Information Interchang) – 1963 год

Кодировка ASCII (American Standard Code for Information Interchang) – 1963 год

– для компьютерной обработки текстовой информации кодирующая первую половину символов с числовыми кодами от 0 до 127

(коды от 0 до 32 отведены не символам, а функциональным клавишам).

Слайд 8

Код символа – порядковый номер Первые 32 символа – управляющие. На

Код символа – порядковый номер
Первые 32 символа – управляющие. На экране

не отражаются, определяют некоторое действие.
Слайд 9

Расширение кода ASCII 1 – 127 совпадают с ASCII 128 –

Расширение кода ASCII

1 – 127 совпадают с ASCII
128 – 225 –

кодовая страница. Размещаются нелатинские алфавиты, символы псевдографики…
Слайд 10

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением

CP1251 ("CP" означает "Code Page", "кодовая страница").
Слайд 11

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был

КОИ8 ("Код обмена информацией, 8-битный"). Unix
Слайд 12

Слайд 13

В конце 90-ых годов появился новый международный стандарт Unicode, который отводит

В конце 90-ых годов появился новый международный стандарт Unicode, который отводит

под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 65536 различных символов.
Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов
Слайд 14

Фрагмент спецификации UNICODE 4.0 для кириллицы

Фрагмент спецификации UNICODE 4.0 для кириллицы

Слайд 15

Пример 1. Представьте в форме шестнадцатеричного кода слово «ЭВМ» во всех

Пример 1. Представьте в форме шестнадцатеричного кода слово «ЭВМ» во всех

пяти кодировках. Воспользуйтесь компьютерным калькулятором для перевода чисел из десятичной в шестнадцатеричную систему счисления
Слайд 16

Ответ Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на

Ответ

   Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на

основе кодировочных таблиц:
КОИ8-Р: 252 247 237
CP1251: 221 194 204
CP866: 157 130 140
Mac: 157 130 140
ISO: 205 178 188
        Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную:
КОИ8-Р: FC F7 ED
CP1251: DD C2 CC
CP866: 9D 82 8C
Mac: 9D 82 8C
ISO: CD B2 BC
Слайд 17

Для преобразования русскоязычных текстовых документов из одной кодировки в другую используются

Для преобразования русскоязычных текстовых документов из одной кодировки в другую используются

специальные программы-конверторы.
Одной из таких программ является текстовый редактор Hieroglyph, который позволяет осуществлять перевод набранного текста из одной кодировки в другую и даже использовать различные кодировки в одном тексте
Слайд 18

Слайд 19

Учимся программировать Возвращает символ, соответствующий номеру N в таблице Юникода.

Учимся программировать

Возвращает символ, соответствующий номеру N в таблице Юникода.

Слайд 20

Возвращает номер символа в таблице КОИ-8r. (стандарт RFC 1489).

Возвращает номер символа в таблице КОИ-8r. (стандарт RFC 1489).