Информация и информационные процессы. 11 класс

Содержание

Слайд 2

Информация и информационные процессы § 1. Количество информации

Информация и информационные процессы

§ 1. Количество информации

Слайд 3

Формула Хартли (1928) I – количество информации в битах N –

Формула Хартли (1928)

I – количество информации в битах
N – количество

вариантов

Пример: В аэропорту стоит 10 самолетов, из них один летит в Санкт-Петербург. Оценить количество информации в сообщении «В Санкт-Петербург летит
второй самолет»?

бита

Слайд 4

Алфавитный подход N – мощность алфавита Информационный объём символа: сообщения длиной

Алфавитный подход

N – мощность алфавита

Информационный объём
символа:

сообщения длиной L:

Пример: сообщение длиной

100 символов закодировано с помощью алфавита из 50 знаков.

вверх до целого числа

6 битов

600 битов

Слайд 5

Количество различных сообщений N – мощность алфавита L – длина сообщения

Количество различных сообщений

N – мощность алфавита
L – длина сообщения
Q – количество

различных сообщений

алфавит: А, Б, В, Г

всего: 4⋅4 = 42 = 16

Слайд 6

Информация и вероятность Доля символов в русских текстах: из 1000 символов около 175 пробелов

Информация и вероятность

Доля символов в русских текстах:

из 1000 символов около 175

пробелов
Слайд 7

Вероятность Вероятность события – число от 0 до 1, показывающее, как

Вероятность

Вероятность события – число от 0 до 1, показывающее, как часто

случается это событие в большой серии одинаковых опытов.

событие никогда не происходит (нет неопределенности)
событие происходит в половине случаев (есть неопределенность)
событие происходит всегда (нет неопределенности)

x2 ≥ 0

x2 < 0

Слайд 8

Вероятность N – количество испытаний m – сколько раз произошло событие

Вероятность

N – количество испытаний
m – сколько раз произошло событие

ровно 2:

чётное:

меньше 3:

2 и

2:

2 чётных:

оба меньше 3:

Слайд 9

Вероятность и информация …АААААААААААААААААА получили букву «А»: …BАААААААААААААААААА получили букву «В»:

Вероятность и информация

…АААААААААААААААААА

получили букву «А»:

…BАААААААААААААААААА

получили букву «В»:

Чем более неожиданно событие, тем

больше получено информации.

В 10 опытах будет получено в 10 раз больше информации, чем в одном (аддитивность).

Слайд 10

Вероятность и информация при K = 1 ⇒ информация в битах

Вероятность и информация

при K = 1 ⇒ информация в битах

Если событие

имеет вероятность p, то количество информации в битах, полученное в сообщении об этом событии, равно
Слайд 11

Вероятность и информация Аддитивность: по 8 шариков разного цвета всего 8⋅8 = 64 варианта

Вероятность и информация

Аддитивность:

по 8 шариков разного цвета

всего 8⋅8 = 64 варианта

Слайд 12

Связь с формулой Хартли N равновероятных событий совпадает с формулой Хартли

Связь с формулой Хартли

N равновероятных событий

совпадает с формулой Хартли

Если вероятности разные:

«Васе

достался зелёный шарик».
Слайд 13

Формула Шеннона Количество полученной информации равно уменьшению неопределенности. I = ΔH

Формула Шеннона

Количество полученной информации равно уменьшению неопределенности.

I = ΔH = Hнач

– Hкон

Неопределённость знаний об источнике данных (N событий, вероятности pi):

информационная энтропия

Слайд 14

Формула Шеннона «Идёт ли сейчас снег?» (1 – да, 2 – нет) зимой: летом:

Формула Шеннона

«Идёт ли сейчас снег?» (1 – да, 2 – нет)

зимой:

летом:

Слайд 15

Когда неопределённость наибольшая? Система двух событий: Неопределенность максимальна, когда все события равновероятны. совпадает с формулой Хартли!

Когда неопределённость наибольшая?

Система двух событий:

Неопределенность максимальна, когда все события равновероятны.

совпадает

с формулой Хартли!
Слайд 16

Информация и информационные процессы § 2. Передача данных

Информация и информационные процессы

§ 2. Передача данных

Слайд 17

Скорость передачи данных Скорость передачи данных – это количество битов (байтов,

Скорость передачи данных

Скорость передачи данных – это количество битов (байтов, Кбайт

и т.д.), которое передается по каналу связи за единицу времени (например, за 1 с).

бит/с = 1 bps (bits per second)

1 кбит/с = 1000 бит/с

1 Мбит/с = 106 бит/с

1 Гбит/с = 109 бит/с

Объём переданных данных:

скорость передачи

время

v = 512000 бит/с, t = 1 мин

I = v ⋅ t = 512000 бит/с ⋅ 60 с = 30 720 000 битов
= 3 840 000 байтов = 3075 Кбайт.

Слайд 18

Обнаружение ошибок Бит чётности: 00 01 10 11 ⇒ 000 011

Обнаружение ошибок

Бит чётности:

00 01 10 11

⇒ 000 011 101 110

Если в

принятом блоке нечётное число «1» – ошибка!

принято: 010 110 000 111 000

Для файлов – контрольные суммы (хэш):

CRC = Cyclic Redundancy Code
MD5, SHA-1

10010

Слайд 19

Помехоустойчивые коды 111 000 000 111 000 – утроение каждого бита

Помехоустойчивые коды

111 000 000 111 000 – утроение каждого бита

принято:

010111000101000

исправлено: 000111000111000

10010

Помехоустойчивый код – это код, который позволяет исправлять ошибки, если их количество не превышает некоторого уровня.

Слайд 20

Расстояние Хэмминга Расстояние Хэмминга – это количество позиций, в которых отличаются

Расстояние Хэмминга

Расстояние Хэмминга – это количество позиций, в которых отличаются два

закодированных сообщения одинаковой длины.

d(001, 100) = 2

d(000, 111) = ?

3

Исправление r ошибок:

d ≥ 2r + 1

Слайд 21

Передача 3-битных блоков dmin= 3 ⇒ r = 1 d(000000, x)

Передача 3-битных блоков

dmin= 3 ⇒ r = 1

d(000000, x) = ?

Исправление

ошибки

принято: 101110

ближайший допустимый код:

101010

Слайд 22

Помехоустойчивые коды Хэмминга 4 полезных бита, 3 контрольных избыточность 3/4 =75%

Помехоустойчивые коды Хэмминга

4 полезных бита, 3 контрольных

избыточность 3/4 =75%

3 = 1

+ 2
5 = 1 + 4
6 = 2 + 4
7 = 1 + 2 + 4

бит 1: (1 + 1 + 0) mod 2 = 0
бит 2: (1 + 0 + 0) mod 2 = 1
бит 4: (1 + 0 + 0) mod 2 = 1

dmin= 3 ⇒ r = 1

Слайд 23

Код Хэмминга: исправление ошибки бит 1: (1 + 1 + 0)

Код Хэмминга: исправление ошибки

бит 1: (1 + 1 + 0) mod

2 = 0
бит 2: (1 + 1 + 0) mod 2 = 0
бит 4: (1 + 1 + 0) mod 2 = 0

Контрольные биты:

Номер ошибочного бита: 2 + 4 = 6

Слайд 24

Длинные коды Хэмминга Контрольные биты: 1, 2, 4, 8, 16, … , 2k

Длинные коды Хэмминга

Контрольные биты:
1, 2, 4, 8, 16, … , 2k

Слайд 25

Информация и информационные процессы § 3. Сжатие данных

Информация и информационные процессы

§ 3. Сжатие данных

Слайд 26

Что такое сжатие? Сообщение: АBА CАBАBА A → 00 B →

Что такое сжатие?

Сообщение: АBА CАBАBА

A → 00
B → 01

АBА CАBАBА

→ 00 01 00 11 10 00 01 00 01 00

20 битов

Словарь:

Слайд 27

Коэффициент сжатия Сообщение: 10240 символов Словарь: 5 байтов Длина кода: 10240×2

Коэффициент сжатия

Сообщение: 10240 символов

Словарь: 5 байтов

Длина кода:
10240×2 = 20480

битов = 2560 байтов

Длина сжатого сообщения:
5 + 2560 = 2565 байтов

Коэффициент сжатия – это отношение размеров исходного и сжатого файлов.

Слайд 28

Сжатие без потерь Сжатие без потерь – это такое уменьшение объема

Сжатие без потерь

Сжатие без потерь – это такое уменьшение объема закодированных

данных, при котором можно восстановить их исходный вид из кода без искажений.

используются только 4 символа из 256

Слайд 29

Алгоритм RLE RLE (англ. Run Length Encoding, кодирование цепочек одинаковых символов)

Алгоритм RLE

RLE (англ. Run Length Encoding, кодирование цепочек одинаковых символов)

100

100

200 байтов

Файл

qq.txt

Файл qq.rle (сжатый)

4 байта

сжатие в 50 раз!

Слайд 30

Алгоритм RLE АААААААААААААААБВ Распаковка: 15 2 Применение: сжатие рисунков *.bmp (с

Алгоритм RLE

АААААААААААААААБВ

Распаковка:

15

2

Применение:
сжатие рисунков *.bmp (с палитрой)
один из этапов сжатия рисунков *.jpg

Слайд 31

Неравномерные коды Идея: кодировать часто встречающиеся символы более короткими кодовыми словами. Азбука Морзе:

Неравномерные коды

Идея: кодировать часто встречающиеся символы более короткими кодовыми словами.

Азбука Морзе:


Слайд 32

Префиксные коды Префиксный код – это код, в котором ни одно

Префиксные коды

Префиксный код – это код, в котором ни одно кодовое

слово не является началом другого кодового слова (условие Фано).

не все символы в листьях!

Слайд 33

Код Шеннона-Фано Количество символов в сообщении: На 2 группы с примерно

Код Шеннона-Фано

Количество символов в сообщении:

На 2 группы с примерно равным

числом символов:

начинаются с 0

начинаются с 1

начинаются с 11

Слайд 34

Код Шеннона-Фано Декодирование: 01100110001101111001 01 10 01 10 00 110 111

Код Шеннона-Фано

Декодирование:

01100110001101111001

01

10

01

10

00

110

111

10

01

Т

O

Т

O

Е

Н

О

Т

Слайд 35

Код Шеннона-Фано учитывается частота символов не нужен символ-разделитель код префиксный –

Код Шеннона-Фано

учитывается частота символов
не нужен символ-разделитель
код префиксный – можно декодировать по

мере поступления данных

нужно заранее знать частоты символов
код неоптимален
при ошибке в передаче сложно восстановить «хвост»
не учитывает повторяющиеся последовательности символов

Слайд 36

Алгоритм Хаффмана По увеличению частоты:

Алгоритм Хаффмана

По увеличению частоты:

Слайд 37

Алгоритм Хаффмана 0 Т 100 Н 101 Код Хаффмана: Е 110 О 111

Алгоритм Хаффмана

0

Т

100

Н

101

Код Хаффмана:

Е

110

О

111

Слайд 38

Сравнение алгоритмов Количество символов в сообщении: Равномерное кодирование (8-битный код): (179

Сравнение алгоритмов

Количество символов в сообщении:

Равномерное кодирование (8-битный код):

(179 +

89 + 72 + 53 + 50) ⋅ 8 = 3544 бита

Равномерное кодирование (3-битный код):

(179 + 89 + 72 + 53 + 50) ⋅ 3 = 1329 битов

+ словарь!

Слайд 39

Сравнение алгоритмов Количество символов в сообщении: (179 + 89 + 50)

Сравнение алгоритмов

Количество символов в сообщении:

(179 + 89 + 50) ⋅

2 + (72 + 53) ⋅ 3 = 1011 битов

179 + (89 + 72 + 53 + 50) ⋅ 3 = 971 бит

Слайд 40

Алгоритм Хаффмана код оптимальный среди алфавитных кодов нужно заранее знать частоты

Алгоритм Хаффмана

код оптимальный среди алфавитных кодов

нужно заранее знать частоты символов
при ошибке

в передаче сложно восстановить «хвост»
не учитывает повторяющиеся последовательности символов
Слайд 41

Алгоритм LZW 1977: А. Лемпел и Я. Зив, 1984: Т. Велч

Алгоритм LZW

1977: А. Лемпел и Я. Зив, 1984: Т. Велч

Идеи:
кодировать

не отдельные символы, а блоки
последовательностям символов присваиваются числовые коды
новая цепочка ⇒ занесение в словарь с новым кодом

словарь строится по мере получения данных
не нужны частоты символов ⇒ за один проход!

Применение:
сжатие рисунков *.gif, *.tif
сжатие документов *.pdf

Слайд 42

Сжатие с потерями Сжатие с потерями – это такое уменьшение объема

Сжатие с потерями

Сжатие с потерями – это такое уменьшение объема закодированных

данных, при которых распакованный файл может отличаться от оригинала.

Применение:
сжатие рисунков *.jpg, *.jpeg
сжатие звука *.mp3, *.aac, *.ogg, …
сжатие видео *.mpg, *.wmv, *.mov, …

Идея: «отбросить» часть данных, которые не влияют на восприятие информации человеком (доп. размытие фотографий, частоты выше 20 кГц, …)

Слайд 43

Снижение глубины цвета размер ↓ качество ↓

Снижение глубины цвета

размер ↓

качество ↓

Слайд 44

Сжатие JPEG Y = 0,299⋅R + 0,587⋅G + 0,114⋅B Cb =

Сжатие JPEG

Y = 0,299⋅R + 0,587⋅G + 0,114⋅B
Cb = 128 –

0,1687⋅R – 0,3313⋅G + 0,5⋅B
Cr = 128 + 0,5⋅R – 0,4187⋅G – 0,0813⋅B

глаз чувствительнее к зелёному!

Cb = Cr = 128

Слайд 45

Сжатие JPEG Идея: глаз наиболее чувствителен к яркости 12 чисел +

Сжатие JPEG

Идея: глаз наиболее чувствителен к яркости

12 чисел

+ дискретное косинусное преобразование,

алгоритмы RLE и Хаффмана

потери!

Слайд 46

Сжатие JPEG Артефакты – заметные искажения из-за сжатия с потерями

Сжатие JPEG

Артефакты – заметные искажения из-за сжатия с потерями

Слайд 47

Сжатие рисунков с потерями и без

Сжатие рисунков с потерями и без

Слайд 48

Сжатие звука (MP3) MP3 = MPEG-1 Layer 3, кодирование восприятия Битрейт

Сжатие звука (MP3)

MP3 = MPEG-1 Layer 3, кодирование восприятия

Битрейт – это

число бит, используемых для кодирования 1 секунды звука.

MP3: от 8 до 320 кбит/c

Без сжатия на CD (1 сек, 44 кГц, 16 бит, стерео):
2×88000 = 176 000 байт = 1 408000 бит = 1408 кбит

Cжатие MP3 (256 кбит/с):

Слайд 49

Сжатие видео видео = изображения + звук Кодек (кодировщик/декодировщик) – это

Сжатие видео

видео = изображения + звук

Кодек (кодировщик/декодировщик) – это программа для

сжатия данных и восстановления сжатых данных.

MJPEG, MPEG-4, DivX, Xvid, H.264, …

Артефакты – заметные искажения из-за сжатия с потерями

Слайд 50

Сжатие: итоги Хорошо сжимаются: тексты (*.txt) документы (*.doc) несжатые рисунки (*.bmp)

Сжатие: итоги

Хорошо сжимаются:
тексты (*.txt)
документы (*.doc)
несжатые рисунки (*.bmp)
несжатый звук (*.wav)
несжатое видео (*.avi)
Плохо

сжимаются:
случайные данные
сжатые данные в архивах (*.zip, *.rar, *.7z)
сжатые рисунки (*.jpg, *.gif, *.png)
сжатый звук (*.mp3, *.aac)
сжатое видео (*.mpg, *.mp4, *.mov)
Слайд 51

Информация и информационные процессы § 4. Информация и управление

Информация и информационные процессы

§ 4. Информация и управление

Слайд 52

Кибернетика Кибернетика – это наука, изучающая общие закономерности процессов управления и

Кибернетика

Кибернетика – это наука, изучающая общие закономерности процессов управления и передачи

информации в машинах, живых организмах и обществе.

Идеи:
управление в любых системах подчиняется одним и тем же законам
управление связано с обменом информацией

Слайд 53

Что такое система? Система – это группа объектов и связей между

Что такое система?

Система – это группа объектов и связей между ними,

выделенных из среды и рассматриваемых как одно целое.

Примеры:
общество
семья
экологическая система
компьютер
файловая система
операционная система

среда

Системный эффект: свойства системы нельзя свести к «сумме» свойств ее компонентов.

самолёт летает!

Слайд 54

Что такое система? Свойства системы: компоненты + связи (алмаз, графит) Подсистема:

Что такое система?

Свойства системы: компоненты + связи (алмаз, графит)

Подсистема: компонент-система.

Системный

анализ: изучение сложных систем на основе теории управления и теории информации.

подсистема

элемент

Надсистема: система более высокого уровня.

Слайд 55

Системы управления Разомкнутая система – регулятор не получает информации о состоянии

Системы управления

Разомкнутая система – регулятор не получает информации о состоянии объекта

(программное управление).

Примеры:
водитель с завязанными глазами
начальник, не проверяющий рабочих
информационное табло на вокзале
светофор

простота – не нужно датчиков

нужна точная модель объекта
нельзя учесть влияние среды

Слайд 56

Системы с обратной связью Замкнутая система – регулятор получает информации о

Системы с обратной связью

Замкнутая система – регулятор получает информации о состоянии

объекта по каналу обратной связи.

усложнение системы (датчики)

модель объекта может быть неточной
можно учесть влияние среды

Отрицательная ОС – регулятор уменьшает разницу между целью и состоянием объекта.

Слайд 57

Типы систем управления Автоматические – работают без участия человека. Автоматизированные –

Типы систем управления

Автоматические – работают без участия человека.

Автоматизированные – собирают и

обрабатывают информацию, а решения принимает человек.

Адаптивные – «подстраиваются» под изменение внешних условия или свойств объекта.

Слайд 58

Информация и информационные процессы § 5. Информационное общество

Информация и информационные процессы

§ 5. Информационное общество

Слайд 59

Что такое информационное общество? Прогресс в обработке информации: письменность (около 3000

Что такое информационное общество?

Прогресс в обработке информации:
письменность (около 3000 лет до

н.э., Египет)
книгопечатание (X век – Китай, XV век – Европа)
средства связи (телеграф, телефон, радио, телевидение; конец XIX – начало XX века);
компьютеры (вторая половина XX века).

Информационное общество – это такая ступень развития цивилизации, на которой главными продуктами производства становятся информация и знания.

Слайд 60

Информатизация Информатизация – переход к информационному обществу: внедрение информационных технологий во

Информатизация

Информатизация – переход к информационному обществу:
внедрение информационных технологий во все сферы

жизни
развитие компьютерных сетей, сотовой связи и т.п.
необходимость компьютерной грамотности для всех
свобода доступа к информации;
доступность образования, в том числе дистанционного (через Интернет)
изменение структуры экономики
изменение уклада жизни людей
Слайд 61

Информатизация Негативные последствия: усиление влияния СМИ разрушается частная жизнь людей сложно

Информатизация

Негативные последствия:
усиление влияния СМИ
разрушается частная жизнь людей
сложно выбрать качественные и достоверные

данные
личное общение людей заменяется общением в Интернете
людям старшего поколения очень сложно приспособиться
Слайд 62

Информационные ресурсы Ресурсы – условия, позволяющие после некоторой «обработки» получить желаемый

Информационные ресурсы

Ресурсы – условия, позволяющие после некоторой «обработки» получить желаемый результат.


Информационные ресурсы – документы в библиотеках, архивах, банках данных, информационных системах.

товар!

Информационные услуги:
поиск и подбор информации
подбор персонала (кадровые агентства)
обучение (учебные центры)
рекламные агентства
консультации, услуги по оптимизации бизнеса
разработка программ и веб-сайтов

Слайд 63

Информационные технологии Технология – это способ сделать «продукт» из исходных материалов

Информационные технологии

Технология – это способ сделать «продукт» из исходных материалов (с

гарантированным результатом!).

Новые информационные технологии – это технологии, связанные с использованием компьютеров для хранения, защиты, обработки и передачи информации.

подготовка документов в электронном виде
поиск информации
телекоммуникации (сети, Интернет, e-mail)
автоматизированные системы управления (АСУ)
системы автоматизированного проектирования (САПР)
геоинформационные системы
обучение (электронные учебники, компьютерные тренажеры, дистанционное обучение).

Слайд 64

Автоматизированные системы управления Ресторан+

Автоматизированные системы управления

Ресторан+

Слайд 65

Автоматизированные системы управления … технологическими процессами (АСУ ТП) рабочее место оператора

Автоматизированные системы управления

… технологическими процессами (АСУ ТП)

рабочее место оператора

блок сбора информации

датчики

блок

управления

локальная сеть

Слайд 66

САПР САПР – системы автоматизированного проектирования

САПР

САПР – системы автоматизированного проектирования

Слайд 67

Геоинформационные системы (ГИС)

Геоинформационные системы (ГИС)

Слайд 68

Дистанционное обучение видеолекции самостоятельная работа письменные задания работа с тьютором (наставником) консультации по Интернету тьютор

Дистанционное обучение

видеолекции
самостоятельная работа
письменные задания
работа с тьютором (наставником)
консультации по Интернету

тьютор

Слайд 69

Дистанционное обучение www.intuit.ru www.edx.org www.udacity.com www.coursera.org Гарвардский университет Массачусетский технологический институт

Дистанционное обучение

www.intuit.ru

www.edx.org

www.udacity.com

www.coursera.org

Гарвардский университет
Массачусетский технологический институт

Стэнфорский университет
Университет Виргиния

33 университета

www.khanacademy.org


Академия Хана

Слайд 70

Компьютерные тренажёры

Компьютерные тренажёры

Слайд 71

Информационная культура Для общества – способность общества эффективно использовать информационные ресурсы

Информационная культура

Для общества – способность общества
эффективно использовать информационные ресурсы и средства

обмена информацией
применять передовые достижения в области информационных технологий

Для человека – умение
формулировать потребность в информации
находить нужную информацию
отбирать и анализировать информацию
представлять информацию в разных видах;
обрабатывать информацию
использовать информацию для принятия решений

Слайд 72

Конец фильма ПОЛЯКОВ Константин Юрьевич д.т.н., учитель информатики ГБОУ СОШ №

Конец фильма

ПОЛЯКОВ Константин Юрьевич
д.т.н., учитель информатики
ГБОУ СОШ № 163, г. Санкт-Петербург
kpolyakov@mail.ru

ЕРЕМИН Евгений Александрович
к.ф.-м.н., доцент кафедры мультимедийной дидактики и ИТО ПГГПУ, г. Пермь
eremin@pspu.ac.ru