МИРЭА_лекция_01.ppt

Содержание

Слайд 2

Искусственный интеллект?

Искусственный интеллект?

Слайд 3

БУДУЩЕЕ

БУДУЩЕЕ

Слайд 4

МАСШТАБ ВРЕМЕНИ 1912 2012

МАСШТАБ ВРЕМЕНИ

1912 2012

Слайд 5

МАСШТАБ ВРЕМЕНИ 1912 2012

МАСШТАБ ВРЕМЕНИ

1912 2012

Слайд 6

МАСШТАБ ВРЕМЕНИ Рост раковой опухоли Рост популяции Рост организма Рост численности населения Рост потребления энергии

МАСШТАБ ВРЕМЕНИ

Рост раковой опухоли

Рост популяции

Рост организма

Рост численности

населения

Рост потребления энергии

Слайд 7

ГЛАВНЫЙ ФАКТОР

ГЛАВНЫЙ ФАКТОР

Слайд 8

ГЛАВНЫЙ ФАКТОР Рост вычислительной мощности компьютеров в соответствии с законом Мура

ГЛАВНЫЙ ФАКТОР

Рост вычислительной мощности компьютеров в соответствии с законом Мура


Слайд 9

Очень близкое будущее (до 2040) такое

Очень близкое будущее (до 2040)

такое

Слайд 10

Очень близкое будущее (до 2040) или такое

Очень близкое будущее (до 2040)

или такое

Слайд 11

14-16 марта 2012 Техническое зрение в системах управления - 2012 Unmanned Aircraft Systems (UAS) Roadmap, 2005-2030

14-16 марта 2012 Техническое зрение в системах управления - 2012

Unmanned Aircraft

Systems (UAS) Roadmap, 2005-2030
Слайд 12

Richard Rumpf Rumpf Associates International, Inc. 14-16 марта 2012 Техническое зрение в системах управления - 2012

Richard Rumpf Rumpf Associates International, Inc.

14-16 марта 2012 Техническое зрение в

системах управления - 2012
Слайд 13

Системы улучшенного и синтезированного видения

Системы улучшенного и синтезированного видения


Слайд 14

Цифровые изображения Изображение как двумерный массив данных Видимое поле представляет собой

Цифровые изображения

Изображение как двумерный массив данных
Видимое поле представляет собой лишь некоторую

функцию распределения яркости или цвета на двумерной плоскости: f(x,y), где x и y – декартовы координаты, описывающие плоскость изображения.
Цифровое изображение представляет собой двумерную матрицу Im[x,y] размера (DimX × DimY), где x – целое число от 0 до DimX – 1, описывающее номер элемента в строке матрицы, y – целое число от 0 до DimY – 1, описывающее номер строки матрицы, в которой расположен данный элемент.
Пиксель (pixel, picture element) – элемент цифрового изображения (ячейка прямоугольной матрицы). В простейшем случае каждый пиксель Im[x,y] имеет скалярное целочисленное значение, пропорциональное значению функции распределения яркости f(x,y) в данной точке плоскости.

Цифровое изображение как двумерная матрица интенсивностей

Цифровое изображение как псевдо-трехмерный рельеф

Слайд 15

Цифровое изображение Лабораторная система обработки и анализа изображений Pisoft Image Framework

Цифровое изображение

Лабораторная система обработки и анализа изображений Pisoft Image Framework

Слайд 16

Физическая природа изображений Изображения различных диапазонов длин волн Диапазоны длин волн электромагнитного излучения

Физическая природа изображений

Изображения различных диапазонов длин волн
Диапазоны длин волн электромагнитного излучения

Слайд 17

Физическая природа изображений Изображения различных диапазонов длин волн Характеристики волн видимой

Физическая природа изображений

Изображения различных диапазонов длин волн
Характеристики волн видимой части спектра

и прилегающих к ним
Слайд 18

Изображения различных диапазонов длин волн Области применения

Изображения различных диапазонов длин волн

Области применения

Слайд 19

Изображения различной физической природы Области применения Многоспектральные изображения: ТВ и два

Изображения различной физической природы

Области применения





Многоспектральные изображения: ТВ

и два ИК диапазона (3-5 и 8-14 мкм).
Слайд 20

Типы изображений Цветные изображения – специальный тип данных, запись формата TcolorRef

Типы изображений





Цветные изображения – специальный тип данных,

запись формата TcolorRef = {Red, Green, Blue}. Разрешение по каждому из каналов – 8 бит. С целью выравнивания до «целого слова» 32-битной архитектуры часто дополняется еще одним 8-битным компонентом: TColorRef32 = {Red, Green, Blue, Reserved}. Цветное изображение – системный тип данных. Он поддерживается всеми устройствами ввода цветовых изображений. Кроме того, стандартный тип данных TRGBBitmap поддерживается операционной системой Windows как часть графического интерфейса на системном уровне;
Многозональные и гиперспектральные изображения – векторные, пиксель представляет собой массив целочисленных значений. Формируются специальными устройствами ввода. Используются для попиксельной классификации и сегментации изображений. На программном уровне, как правило, реализуются не как двумерный массив векторов, а как набор двумерных изображений, каждое из которых соответствует одной зональной или спектральной компоненте;
Слайд 21

Компьютерное зрение как область компьютерной обработки информации Компьютерное и машинное зрение

Компьютерное зрение как область компьютерной обработки информации

Компьютерное и машинное

зрение
Требования к системам и алгоритмам технического зрения: надежность, точность, быстродействие.
Компьютерное зрение = "геометрия сегодня".
Приложения компьютерного зрения.
Слайд 22

Компьютерное зрение Проблемы, связанные с анализом изображений Разнообразие яркостно-геометрических свойств изображения

Компьютерное зрение

Проблемы, связанные с анализом изображений
Разнообразие яркостно-геометрических свойств изображения (яркости,

цвета, текстуры, формы, размеры…).
Изменчивость изображений (яркостная, ракурсная, загораживания…)
Необходимость базы знаний о мире для понимания сцен.
Основные целевые задачи
1. калибровка сенсоров, самоориентация и самопозиционирование;
2. обнаружение объектов и изменений в сцене наблюдения;
3. слежение за объектами;
4. реконструкция поверхностей и обнаружение трехмерных структур;
5. высокоточные измерения элементов сцены;
6. описание сцены и идентификация объектов;
7. организация зрительной обратной связи при работе управляемых устройств, манипуляторов или мобильных роботов в изменчивой среде.
Слайд 23

Уровни и методы компьютерного зрения Модульная парадигма (Д. Марр. «Зрение») Этапы

Уровни и методы компьютерного зрения

Модульная парадигма (Д. Марр. «Зрение»)
Этапы обработки

данных:
предобработка изображений;
сегментация;
выделение геометрической структуры;
определение относительной структуры и семантики.
Уровни обработки данных:
Низкий уровень – на входе изображение на выходе изображение (фильтрация простых шумов, гистограммная обработка);
Средний уровень – на входе изображение на выходе векторная информация, описание в виде элементов и связей между ними (сегментация);
Высокий уровень – на входе описание в терминах элементов изображения на выходе семантическая интерпретация в терминах видимой сцены объектного мира.
Слайд 24

Термины и сопряженные технические дисциплины Компьютерное зрение (computer vision) изучает теорию

Термины и сопряженные технические дисциплины

Компьютерное зрение (computer vision) изучает теорию и

базовые алгоритмы анализа изображений и сцен.
Машинное зрение (machine vision) включает компьютерное зрение и охватывает все проблемы разработки практических систем: выбор схем освещения исследуемой сцены, выбор характеристик датчиков, их количества и геометрии расположения, вопросы калибровки и ориентирования, выбор или разработку оборудования для оцифровки и процессорной обработки, разработку собственно алгоритмов и их компьютерную реализацию.
Слайд 25

Термины и сопряженные технические дисциплины Зрение роботов (robot vision) включает задачи

Термины и сопряженные технические дисциплины

Зрение роботов (robot vision) включает задачи машинного

зрения, решаемые в условиях жестких временных ограничений. Это разработка основанных на изображениях информационных систем, входящих в состав систем управления сложными динамическими объектами (самолет, автомобиль, системы контроля технических и технологических процессов на производстве), а также формирование обратных связей по результатам обработки входных изображений в системах управления, что и требует их быстрого анализа в реальном масштабе времени.
Слайд 26

Термины и сопряженные технические дисциплины Обработка изображений (image processing) в узком

Термины и сопряженные технические дисциплины

Обработка изображений (image processing) в узком смысле

– обработка нижнего уровня, когда результатом обработки изображения снова является изображение.
Понимание изображений (image understanding) - обработка верхнего уровня, часто связанная с применения методов искусственного интеллекта и распознавания образов (pattern recognition).
Слайд 27

Термины и сопряженные технические дисциплины Цифровая фотограмметрия (digital photogrammetry) в узком

Термины и сопряженные технические дисциплины

Цифровая фотограмметрия (digital photogrammetry) в узком смысле

– изучает метрические соотношения между точками снимков и реальной сцены; в широком смысле – почти синоним машинного зрения: рассматривает сложные задачи анализа и 3D описания сцены по видеоданным оптических и других сенсоров.
Короткобазисная фотограмметрия (close-range photogrammetry) в узком смысле – решает задачи высокоточного измерения различных элементов видимой сцены и реконструкции форм трехмерных поверхностей с использованием стерео и многокамерной съемки, а также специального структурированного подсвета.
Слайд 28

Требования к алгоритмам машинного зрения робастность; точность; вычислительная реализуемость. Факторы, осложняющие

Требования к алгоритмам машинного зрения

робастность;
точность;
вычислительная реализуемость.
Факторы, осложняющие решение задач:
помехи и

«шум» – имеют десятки видов источников возникновения, к числу которых можно отнести несовершенство сенсоров приемо-передающей аппаратуры и аппаратуры оцифровки изображений, трудные условия съемки, недостаток освещения и ряд других;
сложный текстурированный фон, на котором должно происходить обнаружение объектов, например, обнаружение штриховой наклейки на схожей с ней по структуре газетной странице и т.п.;
эффекты загораживания (заслонения) одних объектов другими объектами, как правило, не определенной заранее формы, например – облако на космофотоснимке и т.п., загораживающие помехи;
искажающие оптические эффекты в виде различных расфокусировок, дисторсий объективов, ракурсных искажений и др.;
Слайд 29

Требования к алгоритмам машинного зрения Факторы, осложняющие решение задач: эффекты резкой

Требования к алгоритмам машинного зрения

Факторы, осложняющие решение задач:
эффекты резкой смены

освещения, блики, тени, особенно в динамически меняющихся сценах;
разнообразие и изменчивость самих объектов – переменная структура (как у текстовых строк, автомобильных номеров или штриховых кодов), возможные дефекты, временные изменения формы (сгибание-разгибание конечностей, движение механических частей машин), вегетационные циклы для растительности и т.п.;
эффекты изменения среды между сенсорами и объектами наблюдения – задымление, атмосферные осадки, пыль, искусственные помехи и многое другое;
несинхронность регистрации и обработки данных в динамических задачах, связанная с ограничениями быстродействия компьютерных средств хранения и анализа изображений – особенно критична для промышленных приложений с заданным временем реакции на событие. Сюда же можно отнести также сбои в компьютерных программах обработки.
Слайд 30

Компьютерное зрение как обобщение школьной геометрии

Компьютерное зрение как обобщение школьной геометрии

Слайд 31

Как найти окружность?

Как найти окружность?

Слайд 32

Как найти окружность? Проблема: Помимо полезных точек есть ложные

Как найти окружность?

Проблема: Помимо полезных точек есть ложные

Слайд 33

Метод общих геометрических мест Задача 1: Построение треугольника по 3 заданным отрезкам.

Метод общих геометрических мест

Задача 1: Построение треугольника по 3 заданным отрезкам.

Слайд 34

Метод общих геометрических мест Задача 1: Построение треугольника по 3 заданным отрезкам. гмт1

Метод общих геометрических мест

Задача 1: Построение треугольника по 3 заданным отрезкам.

гмт1

Слайд 35

Метод общих геометрических мест Задача 1: Построение треугольника по 3 заданным отрезкам. гмт1 гмт2

Метод общих геометрических мест

Задача 1: Построение треугольника по 3 заданным отрезкам.

гмт1

гмт2

Слайд 36

Метод общих геометрических мест Задача 1: Построение треугольника по 3 заданным

Метод общих геометрических мест

Задача 1: Построение треугольника по 3 заданным отрезкам.

гмт1

гмт2

гмт1

∩ гмт2
Слайд 37

Метод общих геометрических мест Задача 2: Построение окружности по 3 заданным точкам.

Метод общих геометрических мест

Задача 2: Построение окружности по 3 заданным точкам.

Слайд 38

Метод общих геометрических мест Задача 2: Построение окружности по 3 заданным точкам. гмт1

Метод общих геометрических мест

Задача 2: Построение окружности по 3 заданным точкам.

гмт1

Слайд 39

Метод общих геометрических мест Задача 2: Построение окружности по 3 заданным точкам. гмт1 гмт2

Метод общих геометрических мест

Задача 2: Построение окружности по 3 заданным точкам.

гмт1

гмт2

Слайд 40

Метод общих геометрических мест Задача 2: Построение окружности по 3 заданным

Метод общих геометрических мест

Задача 2: Построение окружности по 3 заданным точкам.

гмт1

гмт2

гмт1

∩ гмт2

O

Слайд 41

Метод общих геометрических мест Задача 2: Построение окружности по 3 заданным

Метод общих геометрических мест

Задача 2: Построение окружности по 3 заданным точкам.

гмт1

гмт2

гмт1

∩ гмт2

R

O

Слайд 42

Метод общих геометрических мест Задача 2: Построение окружности по 3 заданным

Метод общих геометрических мест

Задача 2: Построение окружности по 3 заданным точкам.

гмт1

гмт2

гмт1

∩ гмт2

R

O

Слайд 43

Метод общих геометрических мест Задача 3: Построение окружности по N заданным точкам

Метод общих геометрических мест

Задача 3: Построение окружности по N заданным точкам

Слайд 44

Метод общих геометрических мест Задача 3: Построение окружности по N заданным точкам

Метод общих геометрических мест

Задача 3: Построение окружности по N заданным точкам

Слайд 45

Метод общих геометрических мест Задача 3: Построение окружности по N заданным точкам гмт12 R

Метод общих геометрических мест

Задача 3: Построение окружности по N заданным точкам

гмт12

R

Слайд 46

Метод общих геометрических мест Задача 3: Построение окружности по N заданным

Метод общих геометрических мест

Задача 3: Построение окружности по N заданным точкам

гмт12

гмт23

гмт

R

гмт ij

Слайд 47

Метод общих геометрических мест Задача 3: Построение окружности по N заданным точкам гмт12 гмт23 гмт lk

Метод общих геометрических мест

Задача 3: Построение окружности по N заданным точкам

гмт12

гмт23

гмт

lk
Слайд 48

Метод общих геометрических мест Задача 3: Построение окружности по N заданным

Метод общих геометрических мест

Задача 3: Построение окружности по N заданным точкам

гмт12

гмт23

гмт

ij

гмт lk

Больше голосов

Слайд 49

Метод общих геометрических мест Задача 3: Построение окружности по N заданным

Метод общих геометрических мест

Задача 3: Построение окружности по N заданным точкам

гмт12

гмт23

MAX

∩ гмт

R

O

гмт ij

гмт lk

Слайд 50

Компьютерное зрение как школьная геометрия++ Отличия КЗ от классической геометрии: 1.

Компьютерное зрение как школьная геометрия++

Отличия КЗ от классической геометрии:
1. Увеличение числа

точек на порядки.
2. Появление у точек атрибутов интенсивности, цвета и других характеристик.
3. Рассмотрение не только правильных фигур, но и фигур любых других форм.
4. Учет всякого рода неидеальностей, погрешностей, шумов, искажений, дискретностей, неполной наблюдаемости и т.п. реальных факторов, которые, впрочем, также имеют математическое выражение.