Распознавание изображений. Выделение признаков

Содержание

Слайд 2

~ 90% информации человек получает через зрение Это очень информативный источник

~ 90% информации человек получает через зрение
Это очень информативный источник
Множество рутинной

работы людей связано с распознаванием изображений
Гаишник высматривает нарушителей
Работник завода ищет бракованные детали
Охранник сверяет фото на пропуске с лицом человека
Было бы здорово автоматизировать эту работу

Распознавание изображений

Слайд 3

Распознавание изображений В XXI веке появились большие вычислительные мощности Получать цифровые изображения стало очень просто

Распознавание изображений

В XXI веке появились большие вычислительные мощности
Получать цифровые изображения стало

очень просто
Слайд 4

За последние 10 лет произошел огромный толчок КЗ нашло свое применение:

За последние 10 лет произошел огромный толчок
КЗ нашло свое применение:
Распознавание людей (отпечаток

пальца, лицо, сетчатка)
Контроль подлинности (банкнот, документов)
Распознавание текста (ABBY)
Интеллектуальное видеонаблюдение (системы безопасности, письма счастья)
Контроль качества (подсчет длины очереди, поиск течи в трубе)

Распознавание изображений

Слайд 5

Сужаем класс задач Наши условия: Есть изображение На нем есть объект

Сужаем класс задач
Наши условия:
Есть изображение
На нем есть объект
Необходимо отнести его к

одному из известных классов, т.е. решить задачу классификации
Пример:
Распознать букву
Распознать чей отпечаток

Задача распознавания

Слайд 6

Общий алгоритм

Общий алгоритм

Слайд 7

Фильтрация от шума На всех реальных изображениях присутствует шум Шум распределен

Фильтрация от шума

На всех реальных изображениях присутствует шум
Шум распределен в широкой

полосе частот
Не понятно как отделить его от изображения
Слайд 8

Фильтр низких частот Свертка с прямоугольным окном Свертка с гауссовым окном Фильтры низких частот

Фильтр низких частот
Свертка с прямоугольным окном
Свертка с гауссовым окном

Фильтры низких частот

Слайд 9

Выбор окрестности Сортировка Выбор значения из середины Медианный фильтр

Выбор окрестности
Сортировка
Выбор значения из середины

Медианный фильтр

Слайд 10

Фильтрация от шума

Фильтрация от шума

Слайд 11

Метод наращивания и соединения областей Исходное изображение Наращивание Промежуточных областей Смежные области объединяются Сегментированное изображение

Метод наращивания и соединения областей

Исходное изображение

Наращивание
Промежуточных областей

Смежные области объединяются

Сегментированное изображение

Слайд 12

Результат сегментации

Результат сегментации

Слайд 13

Есть картинка, и что? Компьютер понимает только формальное описание Например классификацию

Есть картинка, и что?

Компьютер понимает только формальное описание
Например классификацию точек на плоскости

он бы провести смог
Слайд 14

Очень много информации На обычном hd снимке 1280 * 720 ~

Очень много информации
На обычном hd снимке 1280 * 720 ~ 1

млн. пикселей
Сложно обрабатывать такие большие массивы данных
Не вся информация является полезной для распознавания
Есть информация которая сбивает с толку

Что отличает изображение от точки в пространстве?

Слайд 15

Проблемы освещенности

Проблемы освещенности

Слайд 16

Искажения перспективы

Искажения перспективы

Слайд 17

Аберрации линзы (рыбий глаз)

Аберрации линзы (рыбий глаз)

Слайд 18

Вариация формы

Вариация формы

Слайд 19

Встречаются почти всегда Эталон Сдвиг Масштабное преобразование Поворот

Встречаются почти всегда

Эталон

Сдвиг

Масштабное преобразование

Поворот

Слайд 20

Выделение признаков для изображений символов Предположения: Изображение полутоновое Символ на картинке

Выделение признаков для изображений символов

Предположения:
Изображение полутоновое
Символ на картинке один
Задача:
Сопоставить изображению набор

чисел, достаточный для классификации
Учесть смещение символа
Учесть символы разных масштабов
Учесть символы повернутые на разный угол
Слайд 21

Математическое представление изображения Это функция двух переменных (непрерывный случай) Это матрица (дискретный случай)

Математическое представление изображения

Это функция двух переменных (непрерывный случай)
Это матрица (дискретный случай)

Слайд 22

Математическое представление изображения Справедливы: Сложение Вычитание Умножение Деление Возведение в степень И т.д.

Математическое представление изображения

Справедливы:
Сложение
Вычитание
Умножение
Деление
Возведение в степень
И т.д.

 

Слайд 23

Физическое представление изображения Это плоская фигура (непрерывный случай) Это система материальных

Физическое представление изображения

Это плоская фигура (непрерывный случай)
Это система материальных точек (дискретный

случай)
Чем светлее фрагмент, тем больше он весит
Интенсивность (I) выступает в роли плотности
Здесь и далее рассматриваем буквы
Слайд 24

Инвариантность относительно сдвига Буква – это твердое тело С каждой точкой ТТ можно связать систему координат

Инвариантность относительно сдвига

Буква – это твердое тело
С каждой точкой ТТ можно

связать систему координат

 

Слайд 25

Выбор начала отсчета Нормальный выбор – центр буквы Очень просто вычислить

Выбор начала отсчета

Нормальный выбор – центр буквы
Очень просто вычислить
Но что происходит

при слабом изменении формы?

 

Слайд 26

Центр масс изображения

Центр масс изображения

 

Слайд 27

Центр масс изображения

Центр масс изображения

 

 

 

Слайд 28

Инвариантность относительно масштаба Надо изменить масштаб распознаваемого изображения Какую область масштабировать? Во сколько раз?

Инвариантность относительно масштаба

Надо изменить масштаб распознаваемого изображения
Какую область масштабировать?
Во сколько раз?

Слайд 29

Какую область масштабировать?

Какую область масштабировать?

Слайд 30

Какую область масштабировать? Она должна быть связана с размерами символа Можно

Какую область масштабировать?

Она должна быть связана с размерами символа
Можно выбрать описанный

квадрат или круг
Недостатки все те же, что и раньше
Выгоднее опираться на статистические характеристики
Слайд 31

Статистические характеристики Удобно рассмотреть распределение пикселей по удаленности от центра масс

Статистические характеристики

Удобно рассмотреть распределение пикселей по удаленности от центра масс
Это функция

ρ(r)
По горизонтальной оси – удаление от центра масс
По вертикальной оси количество пикселей, которые находятся на таком расстоянии от центра масс

 

 

Слайд 32

Статистические характеристики Область точно не надо брать уже, чем математическое ожидание

Статистические характеристики

Область точно не надо брать уже, чем математическое ожидание расстояния
Насколько

велик разброс пикселей вокруг среднего показывает дисперсия

 

 

 

 

Слайд 33

Статистические характеристики

Статистические характеристики

 

Слайд 34

Во сколько раз масштабировать? Под размер шаблона с которым будет делаться

Во сколько раз масштабировать?

Под размер шаблона с которым будет делаться сравнение
Шаблон

должен быть
не слишком маленьким
Теряются детали
Не слишком большим
Долго обрабатывать
Исследования показали что оптимальный размер 30 пикселей
Слайд 35

Не случится ли беды? Делаем масштабирование в прямом пространстве Растяжение переходит

Не случится ли беды?

Делаем масштабирование в прямом пространстве
Растяжение переходит в сжатие,

сжатие в растяжение
a < 1 – все хорошо
a > 1 – появились новые высокие частоты

 

Слайд 36

Не случится ли беды? Появление высоких частот при фиксированной частоте дискретизации

Не случится ли беды?

Появление высоких частот при фиксированной частоте дискретизации может

привести к невыполнению теоремы Котельникова
Это означает потерю информации
Чтобы этого не произошло надо убрать высокие частоты из исходной картинки
Слайд 37

Этапы масштабной нормализации Исходный символ Свертка с Гауссовым фильтром Отмасштабированный символ

Этапы масштабной нормализации

Исходный символ

Свертка с Гауссовым фильтром

Отмасштабированный символ

Слайд 38

Линейная алгебра Функция это элемент гильбертова пространства. Как вектор. Скалярное произведение: Ортонормированный базис:

Линейная алгебра

Функция это элемент гильбертова пространства. Как вектор.
Скалярное произведение:
Ортонормированный базис:

Слайд 39

Разложение векторов Если размерность базиса (кол-во векторов в нем) совпадает с

Разложение векторов

Если размерность базиса (кол-во векторов в нем) совпадает с размерностью

пространства, то по такому базису можно делать разложение
В общем случае:
Для ортонормированного базиса
Слайд 40

Моменты В функциональном пространстве скалярное произведение f(x) на g(x) назвали: Момент

Моменты

В функциональном пространстве скалярное произведение f(x) на g(x) назвали:
Момент f(x) относительно

g(x)
Базисы есть разные, еще момент называют по имени базиса
Какие базисы используются?
Слайд 41

Базисы Не ортогональный: Регулярный базис Регулярные моменты Ортогональные Базис Цернике Моменты Цернике Базис Уолша Моменты Уолша

Базисы

Не ортогональный:
Регулярный базис
Регулярные моменты
Ортогональные
Базис Цернике
Моменты Цернике
Базис Уолша
Моменты Уолша

Слайд 42

Полиномы Цернике Ортогональность Легко восстановить изображение Коэффициенты слабо коррелированы Модуль коэффициентов инвариантен к повороту

Полиномы Цернике

Ортогональность
Легко восстановить изображение
Коэффициенты слабо коррелированы
Модуль коэффициентов
инвариантен к повороту

Слайд 43

Восстановление изображения Чтобы восстановить изображение надо найти коэффициенты Формула для восстановления

Восстановление изображения

Чтобы восстановить изображение надо найти коэффициенты
Формула для восстановления

Слайд 44

А если изображение повернуто? Выбираем признаки Либо надо исключить информацию о

А если изображение повернуто?

Выбираем признаки
Либо надо исключить информацию о повороте
Либо надо

все изображения развернуть в исходное положение
Слайд 45

Поворот в исходное положение Вспомним физическую интерпретацию изображения Как у любого

Поворот в исходное положение

Вспомним физическую интерпретацию изображения
Как у любого твердого тела, у

буквы есть собственная система координат
Слайд 46

Определение поворота по собственной системе координат Рассчитывается тензор инерции Определяются собственные

Определение поворота по собственной системе координат

Рассчитывается тензор инерции
Определяются собственные направления
Сравниваются направления

шаблона и изображения
Слайд 47

Модуль моментов Возьмем модуль от моментов Цернике Сделаем сдвиг Очень удобно

Модуль моментов

Возьмем модуль от моментов Цернике
Сделаем сдвиг
Очень удобно