IP-телефонное соединение. Особенности передачи речи по IP. Кодеки

Содержание

Слайд 2

ТфОП и IP

ТфОП и IP

 

Слайд 3

IP-телефонное соединение

IP-телефонное соединение

Слайд 4

Что такое соединение в IP сети? Логическая связь двух устройств Устройства

Что такое соединение в IP сети?

Логическая связь двух устройств
Устройства знают адреса

IP друг друга
Устройства знают номера портов взаимодействующих приложений
Устройства знают какие модули надо подключить к портам транспортных протоколов (кодеки, мультиплексоры, приложения)
Контролируется и управляется качество передачи пользовательских данных
ОКС7, SIP (-T, -I), BICC, H.323, MGCP, H.248/Megaco, SIGTRAN, EDSS-1
Слайд 5

Сценарии IP-телефонии Телефон-телефон Телефон –компьютер Компьютер – телефон Компьютер-компьютер

Сценарии IP-телефонии

Телефон-телефон
Телефон –компьютер
Компьютер – телефон
Компьютер-компьютер

Слайд 6

Соединение абонентов ТфОП через транзитную IP-сеть по сценарию «телефон-телефон»

Соединение абонентов ТфОП через транзитную IP-сеть по сценарию «телефон-телефон»

Слайд 7

Сценарий “компьютер-компьютер”

Сценарий “компьютер-компьютер”

Слайд 8

Сценарий “компьютер-компьютер”

Сценарий “компьютер-компьютер”

Слайд 9

Сценарий «компьютер – телефон»

Сценарий «компьютер – телефон»

Слайд 10

Установление соединения в IP сети

Установление соединения в IP сети

Слайд 11

Установление соединения в IP сети Абонент А набирает местный номер доступа

Установление соединения в IP сети

Абонент А набирает местный номер доступа к

шлюзу
Шлюз запрашивает у специального сервера данные о вызывающем абоненте
Сервер рассматривает информацию АОН для того, чтобы убедится, что абоненту А разрешено пользоваться данной услугой, и затем передает к шлюзу сообщение аутентификации пользователя
Абонент А набирает телефонный номер вызываемого абонента Б
Слайд 12

Установление соединения в IP сети Шлюз консультируется с привратником о возможных

Установление соединения в IP сети

Шлюз консультируется с привратником о возможных способах

маршрутизации вызова
Привратник просматривает адрес E.164 на фоне таблицы маршрутизации и передает к исходящему шлюзу IP-адрес встречного (входящего) шлюза
Исходящий шлюз направляет вызов H.323 по IP – сети к входящему шлюзу
Входящий шлюз направляет вызов по сети ТфОП к вызываемому абоненту
Шлюзы посылают на специальный сервер данные о начале/окончании установления соединения для начисления платы за связь
Слайд 13

Особенности передачи речи по IP

Особенности передачи речи по IP

Слайд 14

Особенности передачи речи по IP-сетям Задержки и вариация задержки Процент потерь

Особенности передачи речи по IP-сетям

Задержки и вариация задержки
Процент потерь пакетов
Критичность

эхоподавления
Новые принципы кодирования речи
Проблемы передачи DTMF и FAX
Слайд 15

Задержки Задержка (время запаздывания) - Промежуток времени, затрачиваемый на то, чтобы

Задержки

Задержка (время запаздывания) - Промежуток времени, затрачиваемый на то, чтобы речевой

сигнал прошел расстояние от говорящего до слушающего
Слайд 16

Задержки 1-й уровень - до 200 мс - отличное качество связи.

Задержки

1-й уровень - до 200 мс - отличное качество связи. Для

сравнения, в ТФОП допустимы задержки до 150-200 мс.

2- й уровень - до 400 мс - считается хорошим качеством связи. Если задержки постоянно удерживаются на верхней границе 2-го уровня (на 400 мс.), то не рекомендуется использовать эту связь для деловых переговоров.

3-й уровень - до 700 мс - считается приемлемым качеством связи для ведения неделовых переговоров. Такое качество связи возможно также при передаче пакетов по спутниковой связи.

Слайд 17

Причины возникновения задержек и способы их уменьшения Влияние сети (сетевые узлы)

Причины возникновения задержек и способы их уменьшения

Влияние сети (сетевые узлы)
Влияние

операционной системы (DSP)
Влияние джиттер-буфера (динамическая длина буфера)
Влияние кодека (выбор кодека)
Слайд 18

Вариация задержки (джиттер)

Вариация задержки (джиттер)

Слайд 19

Причины возникновения и ограничение эффектов эха Причины возникновения эха Электрическая природа

Причины возникновения и ограничение эффектов эха

Причины возникновения эха
Электрическая природа эхо (отражения

в дифсистеме)
Акустическая природа эхо
Устройства ограничения эффектов эха
Эхозаградители отключают канал передачи, когда в канале приема присутствует речевой сигнал
Эхокомпенсаторы моделируют эхосигнал для последующего его вычитания из принимаемого сигнала
Слайд 20

Возникновение эха в традиционных телефонных сетях.

Возникновение эха в традиционных телефонных сетях.

Слайд 21

Возможные отражения электрического сигнала а)

Возможные отражения электрического сигнала

а)

Слайд 22

Способы установки эхокомпенсаторов «предпочтительный способ» б) «централизованный способ»

Способы установки эхокомпенсаторов

«предпочтительный способ»

б)

«централизованный способ»

Слайд 23

Использование полосы пропускания Подавление периодов молчания (VAD, CNG, DTX) Детектор речевой

Использование полосы пропускания

Подавление периодов молчания
(VAD, CNG, DTX)
Детектор речевой активности (Voice

Activity Detector)
Поддержка прерывистой передачи (Discontinuous Transmission)
Генератор комфортного шума (Comfort Noise Generator)
Слайд 24

VAD (Voice Activity Detector) Необходим для определения периодов времени, когда пользователь

VAD (Voice Activity Detector)

Необходим для определения периодов времени, когда пользователь говорит
Оценивает

энергию входного сигнала и, если она превышает некоторый порог, активизирует передачу
Чтобы избежать клиппирования начальной части периода активности, необходимо сохранение в памяти нескольких миллисекунд информации, чтобы иметь возможность запустить передачу до начала периода активности
Слайд 25

Прерывистая передача Discontinuous Transmission, DTX Позволяет кодеку прекратить передачу пакетов в

Прерывистая передача

Discontinuous Transmission, DTX
Позволяет кодеку прекратить передачу пакетов в тот

момент, когда VAD обнаружил период молчания
Некоторые кодеры не прекращают передачу полностью , а переходят в режим передачи гораздо меньшего объема информации, нужной для того, чтобы декодер на удаленном конце мог восстановить фоновый шум
Слайд 26

Генератор комфортного шума Comfort Noise Generator, GNG Генерация фонового шума Простейшие

Генератор комфортного шума

Comfort Noise Generator, GNG
Генерация фонового шума
Простейшие кодеки просто прекращают

передачу в период молчания, и декодер генерирует какой-либо шум с уровнем, равным минимальному уровню, отмеченному в период речевой активности
Более совершенные кодеки предоставляют удаленному декодеру информацию для восстановления шума с параметрами, близкими к фактически наблюдавшимся
Слайд 27

Оценка MOS Рекомендация ITU-T P.800, которая описывает способы получения численных оценок

Оценка MOS

Рекомендация ITU-T P.800, которая описывает способы получения численных оценок качества

речевой информации в сети, участке сети или отдельном оборудовании.
MOS (Mean Opinion Score) – средняя оценка качества большой группы слушателей по 5-ти бальной шкале. Для прослушивания экспертам предлагаются различные звуковые фрагменты:
Речь
Музыка
Речь на фоне различного шума
И т.д.
Слайд 28

MOS (продолжение) Оценки интерпретируются следующим образом: 4-5 – высокое качество, аналогично

MOS (продолжение)

Оценки интерпретируются следующим образом:
4-5 – высокое качество, аналогично качеству передачи

речи в ISDN или еще выше
3,5-4 – качество ТфОП (toll quality)
3-3,5 – качество речи по прежнему удовлетворительно, но его ухудшение хорошо заметно на слух
2,5-3 - речь разборчива, но требует концентрации внимания для понимания
Слайд 29

Недостатки оценки MOS Субъективность оценки Не учитывается влияние: Задержки Вариации задержки

Недостатки оценки MOS

Субъективность оценки
Не учитывается влияние:
Задержки
Вариации задержки
Потери пакетов
Нет возможности производить оценку

на этапе планирования
Слайд 30

Объективный метод оценки качества Рекомендация G.107 В основе метода - E-модель

Объективный метод оценки качества

Рекомендация G.107
В основе метода - E-модель - вычислительная

модель, которая на основе более чем 20 параметров терминалов, линий связи, оборудования и условий разговора определяет оценку качества, так называемый R-фактор
Слайд 31

E - модель В основе Е-модели лежит принцип аддитивности факторов, ухудшающих

E - модель

В основе Е-модели лежит принцип аддитивности факторов, ухудшающих качество

передаваемой речи.
R-фактор вычисляется по следующей формуле:
Фактор R0 представляет собой базовое отношение сигнал-шум, включающее в себя шумы от различных источников.
Слайд 32

E-модель отражает ухудшение качества из-за факторов, которые могут произойти более или

E-модель

отражает ухудшение качества из-за факторов, которые могут произойти более или

менее одновременно с передачей речи (шумы квантования, неоптимальный местный эффект, тихий звук)
выражает ухудшение качества речи, вызванное большой задержкой и эффектами эха
Коэффициент снижения эффективности оборудования Ie-eff отражает ухудшения качества, вызванные кодеками и потерей пакетов.
Слайд 33

E-модель Коэффициент выигрыша А служит для компенсации коэффициентов ухудшений. Если пользователю

E-модель

Коэффициент выигрыша А служит для компенсации коэффициентов ухудшений. Если пользователю предоставляются

дополнительные преимущества можно увеличить значение R-фактора, так как пользователь может ожидать плохого качества от данного вида связи и готов с ним мириться в обмен на предоставляемые преимущества.
Значения R-фактора лежат в пределах от 0 до 93,2, чем больше это значение, тем лучше качество передачи речи.
Слайд 34

Соотношение между оценкой MOS и R-фактором

Соотношение между оценкой MOS и R-фактором

Слайд 35

Передача сигналов DTMF и FAX по IP-сетям Обнаружение на передающем конце

Передача сигналов DTMF и FAX по IP-сетям

Обнаружение на передающем конце
При помощи протокола

сигнализации (SIP, H.248): задержки
При помощи RTP (RFC 2833 “RTP Payload for DTMF Digits, Telephony Tones and Telephony Signals”): реальное время
FAX:
Рекомендация T.37: отложенная доставка факсимильной информации (Store & Forward Fax)
Рекомендация Т.38: доставка факсимильной информации в реальном времени (Fax Relay)
Слайд 36

Кодеки

Кодеки

Слайд 37

Преобразование речевого сигнала Дискретизация Квантование амплитуды Кодирование квантованных амплитуд

Преобразование речевого сигнала

Дискретизация
Квантование амплитуды
Кодирование квантованных амплитуд

Слайд 38

Преобразование речевого сигнала

Преобразование речевого сигнала

Слайд 39

Дискретизация аналоговый сигнал превращается в последовательность импульсов (отсчетов), величина которых равна

Дискретизация

аналоговый сигнал превращается в последовательность импульсов (отсчетов), величина которых равна амплитуде

аналогового сигнала в определенные моменты времени
Теорема Котельникова:
Аналоговый сигнал может быть восстановлен из последовательности отсчетов с частотой f, которая больше или равна умноженной на 2 максимальной частоте, используемой в спектре сигнала F:
Слайд 40

Дискретизация Полоса частот речевого сигнала равна 0,3-3,4 кГц, поэтому частота дискретизации

Дискретизация

Полоса частот речевого сигнала равна 0,3-3,4 кГц, поэтому частота дискретизации аналогового

сигнала была выбрана равной 8 кГц (с запасом).
Эта частота дискретизации является общемировым стандартом .
Слайд 41

Квантование непрерывная величина амплитуды сигнала накладывается на дискретную шкалу квантования и

Квантование

непрерывная величина амплитуды сигнала накладывается на дискретную шкалу квантования и округляется

до ближайшего меньшего значения
используется нелинейная (логарифмическая) шкала квантования, то есть квантованию подвергается не амплитуда сигнала, а ее логарифм
2 закона квантования:
А-закон (применяется в европейских странах и России)
μ-закон (применяется в Северной Америке)
Слайд 42

Квантование Оба закона позволяют закодировать каждый отсчет сигнала 8 битами. Дискретизация

Квантование

Оба закона позволяют закодировать каждый отсчет сигнала 8 битами.
Дискретизация по

времени происходит с частотой 8 кГц, то есть отсчеты генерируются каждые 125 мкс, пропускная способность, необходимая для передачи речи в цифровом виде равна:
Слайд 43

Кодирование Сжатие оцифрованных отсчетов до минимально возможного числа двоичных битов в

Кодирование

Сжатие оцифрованных отсчетов до минимально возможного числа двоичных битов в секунду
Выполняется

после дискретизации и квантования сигнала
Существенно снижает нагрузку на сеть
Слайд 44

Кодирование Значения соседних отсчетов как правило мало отличаются одно от другого,

Кодирование

Значения соседних отсчетов как правило мало отличаются одно от другого, что

позволяет с довольно высокой точностью предсказывать значение любого отсчета на основе значений нескольких предшествующих ему отсчетов.
Эта закономерность используется двумя способами:
Изменение параметров квантования в зависимости от характера сигнала
Линейное предсказание ( дифференциальное кодирование)
Слайд 45

Линейное предсказание Кодируется разность между входным сигналом и «предсказанной» величиной, вычисленной

Линейное предсказание

Кодируется разность между входным сигналом и «предсказанной» величиной, вычисленной на

основе нескольких предыдущих значений сигнала
Пусть:
- отсчеты входного сигнала
- коэффициенты предсказания
Предсказанное значение в момент времени i представляет собой линейную комбинацию нескольких предыдущих отсчетов:
Слайд 46

Линейное предсказание Разность имеет меньший динамический диапазон и может кодироваться меньшим

Линейное предсказание

Разность имеет меньший динамический диапазон и может кодироваться меньшим числом

битов, что позволяет снизить требования к полосе пропускания
Слайд 47

Кодеки Кодеки с ИКМ и адаптивной дифференциальной ИКМ, появившиеся в конце

Кодеки

Кодеки с ИКМ и адаптивной дифференциальной ИКМ, появившиеся в конце 50-х

годов и использующиеся сегодня в системах традиционной телефонии. В большинстве случаев представляют сочетание АЦП/ЦАП
Кодеки с вокодерным преобразованием речевого сигнала. Используют принцип гармонического синтеза сигнала на основе информации о его вокальных составляющих – фонемах
Комбинированные (гибридные) кодеки, которые сочетают в себе технологию вокодерного преобразования/синтеза речи, но оперируют уже с цифровым сигналом специализированных DSP
Слайд 48

Усредненная субъективная оценка качества кодирования речи для различных типов кодеков

Усредненная субъективная оценка качества кодирования речи для различных типов кодеков

Слайд 49

Качество речи Использование полосы пропускания канала Размер кадра Чувствительность к потерям кадров Критерии выбора кодека:

Качество речи
Использование полосы пропускания канала

Размер кадра
Чувствительность

к потерям кадров

Критерии выбора кодека:

Слайд 50

Стандартизированные кодеки Кодек G.711: скорость 64 Кбит/c, оценка MOS - 4.2

Стандартизированные кодеки
Кодек G.711: скорость 64 Кбит/c, оценка MOS - 4.2
Кодек G.723.1:

предусмотрено 2 режима работы:
Кодек G.726: скорость 40, 32, 24 или 16 Кбит/с, оценка - 4.3
Кодек G.728: скорости 16 Кбит/c, оценка - 4.3
Кодек G.729: скорость передачи 8 Кбит/c, оценка – 4,1
Кодек GSM Full Rate: скорость 13 Кбит/c, оценка – 3,7
6.4 Кбит/c, оценка составляет 3.9
5.3 Кбит/с, оценка составляет 3.7
Слайд 51

Сравнительные характеристики кодеков

Сравнительные характеристики кодеков