Сверточная нейронная сеть для распознавания образов

Содержание

Слайд 2

Введение Одной из самых сложных задач в информационных технологиях является задача

Введение

Одной из самых сложных задач в информационных технологиях является задача распознавания

объектов на изображениях. Исследования по распознаванию объектов являются одним из приоритетных направлений развития науки и техники.
Практически у всех систем распознавания символов на изображениях точностные характеристики резко снижаются при искажениях входного изображения.
Для решения данной задачи эффективно использовать нейронные сети в связи с тем, что они слабо чувствительны к искажениям входного сигнала и обладают высокой скоростью распознавания.
Слайд 3

Сверточная нейронная сеть Идея классических сверточных нейронных сетей заключается в использовании

Сверточная нейронная сеть

Идея классических сверточных нейронных сетей заключается в использовании чередующихся

сверточных и субдискретизирующих слоев и многослойного персептрона на выходе.
Слайд 4

Особенности Локальное восприятие. Свертка. Субдискретизация.

Особенности

Локальное восприятие.
Свертка.
Субдискретизация.

Слайд 5

Локальное восприятие Подразумевает, что на вход одного нейрона подается не все

Локальное восприятие

Подразумевает, что на вход одного нейрона подается не все изображение,

а лишь некоторая его область, ограниченная ядром свертки. Каждое ядро свертки формирует собственную карту признаков, делая нейронную сеть многомерной.
Слайд 6

Свертка Операция свертки подразумевает умножение каждого фрагмента изображения поэлементно на ядро

Свертка

Операция свертки подразумевает умножение каждого фрагмента изображения поэлементно на ядро свертки,

которое выступает в качестве матрицы весовых коэффициентов, и суммирование результата. Полученная в итоге матрица является картой признаков данного изображения.
Данная концепция подразумевает использование небольшого количества весовых коэффициентов для большого количества связей. К примеру, 1 изображению размерности 32х32, выделенным из него 4-м картам признаков и ядру свертки размерности 5х5 будет соответствовать 4х5х5 = 100 весовых коэффициентов и 4 пороговых значения, по 1 на каждую карту.
Искусственно введенное ограничение веса положительно влияет на способность сети находить инварианты в изображении и реагировать главным образом на них, не акцентируя внимание на прочие шумы.
Слайд 7

Субдискретизация Субдискретизация уменьшает размерности карт признаков. В качестве операции сжатия используется

Субдискретизация

Субдискретизация уменьшает размерности карт признаков. В качестве операции сжатия используется выбор

максимального элемента из ядра обхода или их усреднение.
Данная операция ускоряет дальнейшие вычисления и обеспе-чивает инвариантность к масштабу.
Слайд 8

MNIST Для сравнения сверточных нейронных сетей будет использоваться MNIST - база

MNIST

Для сравнения сверточных нейронных сетей будет использоваться MNIST - база данных

рукописных цифр, содержащая 60 000 образов для обучения и 10 000 образов для тестирования. Размерность образов 28х28 пикселей.
Пример первых 12 цифр из обучающего набора:
Слайд 9

Сверточная сеть Яна Лекуна Сверточная сеть Яна Лекуна для распознавания рукописных

Сверточная сеть Яна Лекуна

Сверточная сеть Яна Лекуна для распознавания рукописных цифр

из базы данных MNIST представляет собой нейронную сеть из 8-ми слоев (с учетом входного, полносвязного и выходного слоев) использующую чередующиеся сверточные и субдискретизи-рующие слои и многослойный персептрон на выходе.
Слайд 10

Структура сверточной сети Яна Лекуна

Структура сверточной сети Яна Лекуна

Слайд 11

Структура сверточной сети Яна Лекуна Входной слой. Одно изображение размерности 32х32.

Структура сверточной сети Яна Лекуна

Входной слой. Одно изображение размерности 32х32.
Сверточный

слой. 6 карт признаков размерности 28х28 (ядро обхода 5х5).
Субдискретизирующий слой. 6 карт признаков размерности 14х14.
Сверточный слой. 16 карт признаков размерности 10х10 (ядро обхода 5х5).
Субдискретизирующий слой. 16 карт признаков размерности 5х5.
Сверточный слой. 120 карт признаков размерности 1х1 (ядро обхода 6х6).
Полносвязный слой. 84 нейрона.
Выходной слой. 10 нейронов.
Слайд 12

Модифицированная сеть Яна Лекуна Модифицированная нейронная сеть Я. Лекуна состоит из

Модифицированная сеть Яна Лекуна

Модифицированная нейронная сеть Я. Лекуна состоит из 6

слоев. Размерность входного изображения 28x28. Убран полносвязный слой. Количество и размерность карт признаков изменены. Функции активации сети сигмоидные. Количество элементов в групповой выборке: 50.
Слайд 13

Структура модифицированной сети Яна Лекуна

Структура модифицированной сети Яна Лекуна

Слайд 14

Структура модифицированной сети Яна Лекуна Входной слой. Одно изображение размерности 28х28.

Структура модифицированной сети Яна Лекуна

Входной слой. Одно изображение размерности 28х28.
Сверточный

слой. 8 карт признаков размерности 24х24 (ядро обхода 5х5).
Субдискретизирующий слой. 8 карт признаков размерности 12х12.
Сверточный слой. 16 карт признаков размерности 8х8 (ядро обхода 5х5).
Субдискретизирующий слой. 16 карт признаков размерности 4х4.
Выходной слой (сверточный слой). 10 нейронов (ядро обхода 4х4).
Слайд 15

Сравнение сетей Как мы видим, модифицированная сеть обладает большей скоростью отклика

Сравнение сетей

Как мы видим, модифицированная сеть обладает большей скоростью отклика из-за

меньшего числа слоев, занимает меньший объем памяти в связи с меньшим количеством хранимых признаков и показывает более высокую точность распознавания в сравнении с классической (LeNet5) сверточной сетью Я. Лекуна.
Слайд 16

Результаты классификации различных сверточных сетей

Результаты классификации различных сверточных сетей