Преобразование речевых сигналов в цифровую форму. Лекция № 4

Содержание

Слайд 2

2 Целевая установка Учебные цели - раскрыть: 1. Классификацию методов цифрового

2

Целевая установка
Учебные цели - раскрыть:
1. Классификацию методов цифрового кодирования речевых

сигналов
2. Методы разностного квантования речевых сигналов. Кодеры формы
3. Методы низкоскоростного кодирования речевых сигналов
Воспитательные цели – формирование и развитие у обучающихся качеств и отношений гражданина-патриота, военного профессионала и высоконравственной разносторонне развитой личности
Слайд 3

3 Учебные вопросы: 1. Классификация методов цифрового кодирования речевых сигналов 2.

3

Учебные вопросы:

1. Классификация методов цифрового кодирования речевых сигналов
2.

Методы разностного квантования речевых сигналов. Кодеры формы
3. Методы низкоскоростного кодирования речевых сигналов
Слайд 4

4 Первый учебный вопрос: 1. Классификация методов цифрового кодирования речевых сигналов

4

Первый учебный вопрос:

1. Классификация методов цифрового кодирования речевых сигналов


Слайд 5

5 Цифровая система передачи информации

5

Цифровая система передачи информации

Слайд 6

6 Импульсно-кодовая модуляция – PCM-pulse code modulation-1960

6

Импульсно-кодовая модуляция – PCM-pulse code modulation-1960

Слайд 7

7 Преобразования PCM-сигн., повыш.эффективн. их передачи Алгоритмы сжатия речи, фильтрация, квантизация

7

Преобразования PCM-сигн., повыш.эффективн. их передачи

Алгоритмы сжатия речи,
фильтрация,
квантизация


предсказание - с целью точного восстановления сигнала на приёмном конце радиолинии
Слайд 8

8 Список сокращений

8

Список сокращений

Слайд 9

9 Список сокращений

9

Список сокращений

Слайд 10

10 Вокодер - (англ. voice coder – кодировщик голоса) – устройство

10

Вокодер - (англ. voice coder – кодировщик голоса)

– устройство синтеза

речи на основе произвольного сигнала с богатым спектром
Был разработан в целях экономии частотных ресурсов радиолинии системы связи при передаче речевых сообщений
Слайд 11

11 Вокодер - (англ. voice coder – кодировщик голоса) Экономия достигается

11

Вокодер - (англ. voice coder – кодировщик голоса)

Экономия достигается за

счёт того, что вместо собственно речевого сигнала передают только значения его определённых параметров,
которые на приёмной стороне управляют синтезатором речи.
Слайд 12

12 Структурная схема вокодера

12

Структурная схема вокодера

Слайд 13

13 Основу синтезатора речи составляют три элемента: Генератор тонального сигнала для

13

Основу синтезатора речи составляют три элемента:

Генератор тонального сигнала для формирования гласных

звуков;
Генератор шума для формирования согласных;
И система формантных фильтров для воссоздания индивидуальных особенностей голоса
Слайд 14

14 Формантный фильтр это система резонансных фильтров, предназначенная для генерации речевого

14

Формантный фильтр

это система резонансных фильтров, предназначенная для генерации речевого сигнала

с заданной фонетической структурой.
Формантный фильтр является одним из ключевых компонентов в системах синтеза речи и речеподобных сигналов.
Слайд 15

15 Формантный фильтр В основу структуры формантного фильтра заложена упрощённая модель

15

Формантный фильтр

В основу структуры формантного фильтра заложена упрощённая модель голосового тракта.


В соответствии с моделью, голосовой тракт представляет собой резонатор с несколькими пиками АЧХ, частоты которых определяют вид произносимой фонемы.
Эти пики АЧХ получили название форманты. 
Слайд 16

16 Пример спектра фонемы «А»:

16

Пример спектра фонемы «А»:

Слайд 17

17 Форма́нта — термин фонетики, обозначающий акустическую характеристику звуков речи (прежде

17

Форма́нта

— термин фонетики, обозначающий акустическую характеристику звуков речи (прежде всего гласных), связанную с уровнем частоты

голосового тона и образующую тембр звука[1]
Введён в практику научных исследований немецким физиологом Лудимаром Германом в 1894 году.
Слайд 18

18 Спектр и спектрограмма русской гласной «е», показывающие 5 формант

18

Спектр и спектрограмма

русской гласной «е», показывающие 5 формант

Слайд 19

19 Формантный фильтр создаёт формантные области в спектре входного сигнала с

19

Формантный фильтр создаёт

формантные области в спектре входного сигнала с

помощью нескольких параллельно соединённых полосовых или фазовых фильтров.
Количество звеньев в схеме определяет порядок формантного фильтра.
Слайд 20

20 Схема формантного фильтра третьего порядка:

20

Схема формантного фильтра третьего порядка:

Слайд 21

21 Схема формантного фильтра : Чтобы синтезировать речевой сигнал, соответствующий определённой

21

Схема формантного фильтра :

Чтобы синтезировать речевой сигнал, соответствующий определённой фонеме,

необходимо настроить центральную частоту каждого полосового фильтра системы на соответствующую частоту форманты.
Слайд 22

22 Для формантного фильтра : Входным воздействием могут служить различные сигналы

22

Для формантного фильтра :

Входным воздействием могут служить различные сигналы с

различной окраской тембра.
Основными параметрами входного сигнала являются частота повторения и ширина спектра.
Частота повторения определяет высоту тона синтезируемой фонемы и лежит в пределах от 200 Гц до 2000 Гц.
Слайд 23

23 Для формантного фильтра : При этом нижние частоты данного диапазона

23

Для формантного фильтра :

При этом нижние частоты данного диапазона соответствуют

тембру мужского голоса, верхние — женского.
Занимаемый входным сигналом диапазон частот должен быть как можно шире.
В качестве такого сигнала часто используется импульсная последовательность.
Слайд 24

24 Второй учебный вопрос: 2. Методы разностного квантования речевых сигналов. Кодеры формы

24

Второй учебный вопрос:

2. Методы разностного квантования речевых сигналов. Кодеры формы


Слайд 25

25 Структурная схема системы связи с предсказанием

25

Структурная схема системы связи с предсказанием

Слайд 26

26 Структурная схема системы с дельта-модуляцией

26

Структурная схема системы с дельта-модуляцией

Слайд 27

27 Принцип формирования сигналов с дельта-модуляцией

27

Принцип формирования сигналов с дельта-модуляцией

Слайд 28

- последовательность коррелированных отсчётов - сигнал предсказания - сигнал ошибки предсказания

- последовательность коррелированных отсчётов
- сигнал предсказания
- сигнал

ошибки предсказания
- предсказанное значение нового отсчёта
- принятое значение сигнала ошибки предсказания

28

Слайд 29

Восстановленный истинный отсчёт 29

Восстановленный истинный отсчёт

29

Слайд 30

При ЦСПИ Сигнал ошибки подвергается операциям квантования и кодирования Результат такого

При ЦСПИ

Сигнал ошибки подвергается операциям квантования и кодирования
Результат такого преобразования –

импульсно-кодовое представление сигнала ошибки, или
Сигнал дифференциальной импульсно-кодовой модуляции (ДИКМ)

30

Слайд 31

Дельта-модуляция - квантованный сигнал ошибки, где 31

Дельта-модуляция

- квантованный сигнал ошибки,
где

31

Слайд 32

Система передачи информации дельта-модуляцией Достоинство - сравнительная простота кодирующих и декодирующих

Система передачи информации дельта-модуляцией

Достоинство - сравнительная простота кодирующих и декодирующих устройств
Недостаток

- явление размножения ошибок

32

Слайд 33

33 Третий учебный вопрос: 3. Методы низкоскоростного кодирования речевых сигналов

33

Третий учебный вопрос:

3. Методы низкоскоростного кодирования речевых сигналов

Слайд 34

34 Методы низкоскоростного кодирования речевых сигналов Передача речи в цифровой форме

34

Методы низкоскоростного кодирования речевых сигналов

Передача речи в цифровой форме

Слайд 35

35 Методы низкоскоростного кодирования речевых сигналов Упрощенная схема вокодера системы

35

Методы низкоскоростного кодирования речевых сигналов

Упрощенная схема вокодера системы

Слайд 36

Метод линейного предсказания Остаток предсказания В схемах с линейным предсказанием (Linear

Метод линейного предсказания

Остаток предсказания

В схемах с линейным предсказанием

(Linear Predictive Coding) необходимые характеристики извлекаются не из частотного спектра, а из временной формы сигнала.

Речь воссоздается пропусканием возбуждающего сигнала через модель речеобразующего тракта на основе знания:
- типа возбуждения (гласные, звонкие/глухие согласные) speech/noise;
периода основного тона, обычно бывает в диапазоне 2-18 мсек;
- коэффициентов усиления;
- коэффициентов предсказания (параметры модели речеобразующего тракта)-predictive coefficients.

Передача речи с применением LPC

36

Слайд 37

37 Передача речи с применением LPC .

37

Передача речи с применением LPC .

Слайд 38

38 Схема процедуры «анализ через синтез»

38

Схема процедуры «анализ через синтез»

Слайд 39

39 КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР CELP - метод линейного предсказания

39

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР

CELP - метод линейного предсказания

с кодовым возбуждением (дальнейшее развитие LPC). В этом случае в канал связи дополнительно передаются параметры отклонения от модели сигнала, в результате качество речи повышается, однако CELP требует минимум пропускной способности канала связи 4.8 кбит/с.
Слайд 40

40 КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР CELP применяется в системах одноканальной

40

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР

CELP применяется в системах одноканальной

спутниковой связи (DAMA в ИСЗ "Интелсат"), мобильной (в ИСЗ "Инмарсат" и др.), системе ДЦМЕ типа DTX-360, сети Интернет и наземных системах сотовой связи. Различные разновидности CELP стандартизованы международными рекомендациями, например:
- G.728 - LD-CELP (Low Delay - CELP), 16 кбит/с;
- G.729 - CS-ACELP (Conjugate Structure - Algebraic CELP), 8 кбит/с.
- FD-STD-1016 (CELP-3.2).
Слайд 41

41 КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР Разновидности CELP и иных алгоритмов

41

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР

Разновидности CELP и иных алгоритмов
RELP

(Residual Exited Linear Prediction) - линейное предсказание с усеченным возбуждением (сигнал погрешности предсказания ограничивается по частоте и прореживается). Используется в стандарте сотовой связи GSM.
A-CELP (Algebraic CELP) - одна из наиболее перспективных разновидностей CELP. Используется в таких широко распространенных алгоритмах, как G.723.1, G.729. «Algebraic» - метод поиска нужного вектора в кодовой книге.
RELP (Relaxation Code Excited Linear prediction) - используется в кодеке EVRC американского стандарта сотовой связи CDMA IS-127.
Слайд 42

42 КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР MELP (Mixed Excitation Linear Prediction)

42

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР

MELP (Mixed Excitation Linear Prediction)

– используется в новейших низкоскоростных военных алгоритмах США и НАТО и в новом международном стандарте НКР.
VSELP (Vector Sum Excited Coder) – используется в стандартах сотовой связи США IS-54 и европейском стандарте сотовой связи GSM-HR.
MPE (MultiPulse Excitation) - линейное предсказание с многоимпульсным возбуждением. Вместо сигнала ошибки предсказания используют искусственную последовательность возбуждения речевого сигнала на некотором временном интервале. На основе данного метода разработан стандарт GSM.
Слайд 43

43 КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР MP-MLQ (MultiPulse Maximum Likelihood Quantazation)

43

КРАТКИЙ ОБЗОР ОСНОВНЫХ АЛГОРИТМОВ НКР

MP-MLQ (MultiPulse Maximum Likelihood Quantazation)

- алгоритм многоимпульсного возбуждения с квантованием по максимальному правдоподобию. Краткое описание данного метода приведено при описании стандарта G.723.1.
HVEC (Harmonic Vector Excitation Coding) - алгоритм, позволяющий добиваться скоростей передачи даже ниже, чем при CELP (2-4 кбит/с, а при переменной скорости передачи возможно временное понижение до 1.2 кбит/с). Данный алгоритм используется в качестве одного из алгоритмов кодирования аудио в мультимедийном стандарте МPEG-4 и ряде фирменных стандартов.
Слайд 44

44 Кодек речи стандарта GSM 414

44

Кодек речи стандарта GSM 414

Слайд 45

45 Сравнительная характеристика кодеров речи по параметру качества передачи речи

45

Сравнительная характеристика кодеров речи по параметру качества передачи речи

Слайд 46

46 Аудиоданные, кодированные в соответствии с рекомендацией G.722

46

Аудиоданные, кодированные в соответствии с рекомендацией G.722

Слайд 47

47 Структура сигнала с дельта-модуляцией

47

Структура сигнала с дельта-модуляцией

Слайд 48

48 Примеры структур кадров кодеров речи в битовом представлении Структура потока

48

Примеры структур кадров кодеров речи в битовом представлении

Структура потока G.728

16 кбит/c (период 80 бит)
Слайд 49

49 Примеры структур кадров кодеров речи в битовом представлении Канал G.729

49

Примеры структур кадров кодеров речи в битовом представлении

Канал G.729 8

кбит/сек в режиме молчания (кадр 80 бит с начала кадра)
Слайд 50

50 Примеры структур кадров кодеров речи в битовом представлении Канал G.729

50

Примеры структур кадров кодеров речи в битовом представлении

Канал G.729 8

кбит/сек в режиме передачи (кадр 352 бита с начала кадра)
Слайд 51

51 Примеры структур кадров кодеров речи в битовом представлении Кадр G.723.1, длина 192 бита, 6.4 кбит/с

51

Примеры структур кадров кодеров речи в битовом представлении

Кадр G.723.1, длина

192 бита, 6.4 кбит/с
Слайд 52

52 Примеры структур кадров кодеров речи в битовом представлении Структура сигнала

52

Примеры структур кадров кодеров речи в битовом представлении

Структура сигнала GSM,

13 кбит/с, кадр 260 бит
Слайд 53

53 Примеры структур кадров кодеров речи в битовом представлении Кадр FED-STD 1016, 144 бита (4.8 кбит/с)

53

Примеры структур кадров кодеров речи в битовом представлении

Кадр FED-STD 1016,

144 бита (4.8 кбит/с)
Слайд 54

Структура кадра потока GSM 16 кбит/с Примеры структур кадров кодеров речи в битовом представлении 54

Структура кадра потока GSM 16 кбит/с

Примеры структур кадров кодеров

речи в битовом представлении

54

Слайд 55

Семенов К.В., Карасев В.Т., Гурский С.М. Радиотехнические системы: Курс лекций. Часть

Семенов К.В., Карасев В.Т., Гурский С.М. Радиотехнические системы: Курс лекций. Часть

2. – / К.В. Семенов, В.Т. Карасев, С.М. Гурский. – СПб.: ВКА имени А.Ф. Можайского, 2016. – 141 с.
Семенов К.В., Карасев В.Т., Гурский С.М. Радиотехнические системы: курс лекций. – Часть 1. – / К.В. Семенов, В.Т. Карасев, С.М. Гурский. – СПб.: ВКА имени А.Ф. Можайского, 2016. – 195 с.

Бережной И.В., Гурский С.М., Сазонов К.В. Радиотехнические системы: Сборник заданий на практические занятия / И.В. Бережной, С.М. Гурский, К.В. Сазонов. – СПб.: ВКА имени А.Ф. Можайского, 2016. – 243 с.

Основные учебники и учебные пособия

55

Слайд 56

https://sites.google.com/site/eltechdigicom/course_materials Сергиенко А.Б. Цифровая связь: материалы курса «Цифровая связь» для магистрантов

https://sites.google.com/site/eltechdigicom/course_materials
Сергиенко А.Б. Цифровая связь: материалы курса «Цифровая связь» для магистрантов СПбГЭТУ

«ЛЭТИ», в том числе учебные пособия, презентации и видеолекции

Дополнительные учебники

56

Слайд 57

https://sites.google.com/site/eltechdigicom/ 57

https://sites.google.com/site/eltechdigicom/

57

Слайд 58

Информационные технологии в радиотехнических системах: Учебное пособие / В.А.Васин, И.Б.Власов, Ю.М.Егоров

Информационные технологии в радиотехнических системах: Учебное пособие / В.А.Васин, И.Б.Власов, Ю.М.Егоров

и др.; Под ред. И.Б.Федорова. – М.: Изд-во МГТУ им. Н.Э.Баумана, 2003. – 672 с. – (Сер. Информатика в техническом университете)

Дополнительные учебники

58

Слайд 59

59 Дополнительные учебники Радиоэлектронные системы: основы построения и теория. Справочник /

59

Дополнительные учебники

Радиоэлектронные системы: основы построения и теория. Справочник / Ширман

Я.Д., Лосев Ю.И., Минервин Н.Н. и др. / Под ред. Я.Д.Ширмана. – М.: ЗАО «МАКВИС», 1998. – 828 с.
Слайд 60

60 Дополнительные учебники Теория передачи сигналов: Учебник для вузов / А.Г.Зюко,

60

Дополнительные учебники

Теория передачи сигналов: Учебник для вузов / А.Г.Зюко, Д.Д.Кловский,

М.В.Назаров, Л.М.Финк. – 2-е изд., перераб. и доп. - М.: Радио и связь, 1986. – 304 с. – Тираж 22000 экз. – Цена 1 рубль
Слайд 61

61 Дополнительные учебники Беллами Дж. Цифровая телефония: Пер.с англ./Под ред. А.Н.Берлина,

61

Дополнительные учебники

Беллами Дж. Цифровая телефония: Пер.с англ./Под ред. А.Н.Берлина, Ю.Н.Чернышова.

– М.: Эко-Трендз, 2004. – 640 с.
Слайд 62

Прокис Джон. Цифровая связь/Пер.с англ. под ред. Д.Д. Кловского.-М.: Радио и

Прокис Джон. Цифровая связь/Пер.с англ. под ред. Д.Д. Кловского.-М.: Радио и

связь, 2000. - 800 с.

Дополнительные учебники

Скляр Бернард. Цифровая связь. Теоретические основы и практическое применение. Изд. 2-е, испр.: Пер. с англ. – М.: Издательский дом «Вильямс», 2003. – 2016. – 1104 с.

62

Слайд 63

63 Примеры периодических изданий

63

Примеры периодических изданий

Слайд 64

64 Журнал Электросвязь

64

Журнал Электросвязь

Слайд 65

65 Журнал Электросвязь: содержание

65

Журнал Электросвязь: содержание

Слайд 66

66 Военно-научная работа (ВНР) на 62 кафедре Разработана ВНР курсантом 5-го

66

Военно-научная работа (ВНР) на 62 кафедре

Разработана ВНР курсантом 5-го курса

Полубенцевым
Основные результаты указанной ВНР опубликованы в рецензируемом издании – ВАК-журнале «Современные наукоёмкие технологии» №1 2022 г.
Слайд 67

67 ВНР на 62 кафедре Гурский С.М., Полубенцев В.А. Информационная безопасность

67

ВНР на 62 кафедре

Гурский С.М., Полубенцев В.А. Информационная безопасность в

информационно-телекоммуникационной сети «интернет» // Современные наукоемкие технологии. – 2022. – № 1. – С. 25-31; URL: https://top-technologies.ru/ru/article/view?id=39005 (дата обращения: 04.02.2022). – DOI 10.17513/snt.39005.
Слайд 68

68 ВНР на 62 кафедре

68

ВНР на 62 кафедре

Слайд 69

69 ВНР на 62 кафедре

69

ВНР на 62 кафедре

Слайд 70

70 ВНР на 62 кафедре

70

ВНР на 62 кафедре

Слайд 71

71 ВНР на 62 кафедре

71

ВНР на 62 кафедре

Слайд 72

72 Структура ЦСПИ

72

Структура ЦСПИ

Слайд 73

73 Структура ЦСПИ Назначение структурных элементов ЦСПИ подробно описано в книге Бернарда Скляра

73

Структура ЦСПИ

Назначение структурных элементов ЦСПИ подробно описано в книге Бернарда

Скляра
Слайд 74

73 Структура ЦСПИ Книга посвящена свободно распространяемому пакету Octave. Читатель держит

73

Структура ЦСПИ
Книга посвящена свободно распространяемому пакету Octave. Читатель держит в руках

первое описание пакета на русском языке. Описан встроенный язык пакета, подробно рассмотрены графические возможности пакета.
Подробно рассмотрено решение различных инженерных и математических задач. Особое внимание уделено операциям с матрицами, решению нелинейных уравнений и систем, дифференцированию и интегрированию, решению дифференциальных уравнений, оптимизационным задачам и обработке экспериментальных данных (интерполяции и аппроксимации). Наряду со встроенным языком пакета описана среда QtOctave
Слайд 75

73 https://www.altlinux.org/Books:Octave GNU Octave - это свободный интерпретирующий язык для проведения

73

https://www.altlinux.org/Books:Octave
GNU Octave - это свободный интерпретирующий язык для проведения математических вычислений.

По возможностям и качеству реализации интерпретатора язык Octave можно сравнивать с проприетарной программой MATLAB, причём синтаксис обоих языков очень схож.
Существуют версии языка для различных дистрибутивов GNU Linux (ALT Linux, Debian, Ubuntu, Mandriva и др.) и для ОС Windows. На наш взгляд, GNU Octave больше ориентирован на работу в Linux. Работа в ОС Windows возможна, но пользователю Windows надо быть готовым работать с простым текстовым редактором и командной строкой.
Когда авторы начинали знакомиться с GNU Octave, основной проблемой было отсутствие хорошего русскоязычного введения в этот язык. Наша книга является попыткой восполнить этот пробел. Поэтому большое внимание было уделено самому языку (глава 3), операциям с матрицами (глава 5) и графическим возможностям пакета (глава 4).
Слайд 76

73 http://opds.spbsut.ru/data/_uploaded/books/octave_book.pdf Наш многолетний опыт преподавания информационных дисциплин в Донецком национальном

73

http://opds.spbsut.ru/data/_uploaded/books/octave_book.pdf
Наш многолетний опыт преподавания информационных дисциплин в Донецком национальном техническом

университете говорит нам о том, что студенту и инженеру наряду с описанием функций, предназначенных для решения той или иной задачи, не лишним будет напомнить и математическую постановку решаемой задачи, а зачастую и численные методы решения задачи. Именно поэтому в ряде глав приведены не только описания функций, но и описаны численные методы решения задач.
Что касается графических оболочек, таких как qtOctave, Xoctave и Kalculus, нами принято решение кратко описать наиболее стабильную из них, qtOctave, а основное внимание в книге уделить собственно языку. Мы считаем, что GNU Octave - это в первую очередь мощный интерпретирующий язык. Зная его, пользователь сможет работать с любой графической оболочкой.
Авторы выражают благодарность компании ALT Linux за многолетнее сотрудничество и возможность издать очередную книгу.
Авторы заинтересованы в общении с читателями. Мы ждём ваши замечания и отзывы по адресам EAlekseev@gmail.com и chesn_o@list.ru.
Слайд 77

73 http://opds.spbsut.ru/data/_uploaded/books/octave_book.pdf https://kmu.itmo.ru/ Конгресс молодых учёных Университета ИТМО (https://kmu.itmo.ru/) Конгресс молодых

73

http://opds.spbsut.ru/data/_uploaded/books/octave_book.pdf

https://kmu.itmo.ru/
Конгресс молодых учёных Университета ИТМО (https://kmu.itmo.ru/)
Конгресс молодых учёных Университета ИТМО

- научная конференция для школьников, студентов, аспирантов и молодых учёных. КМУ ИТМО