Проблемы простых сверток. Инвариантность

Содержание

Слайд 2

Проблемы простых сверток Spatial Transformer Networks (STN) Capsule Networks (CapsNet)

Проблемы простых сверток
Spatial Transformer Networks (STN)
Capsule Networks (CapsNet)

Слайд 3

 

Слайд 4

 

Слайд 5

Чтобы сегментировать объект нужна эквивариантность. Чтобы классифицировать объект нужна инвариантность.

Чтобы сегментировать объект
нужна эквивариантность.

Чтобы классифицировать объект
нужна инвариантность.

Слайд 6

Свертки эквивариантны к сдвигам. Q: Как сделать свертки инвариантными к малым сдвигам? Использовать Pooling.

Свертки эквивариантны к сдвигам.

Q: Как сделать свертки инвариантными к
малым сдвигам?

Использовать

Pooling.
Слайд 7

Повороты

Повороты

Слайд 8

Изменение масштаба

Изменение масштаба

Слайд 9

Сети инварианты к сдвигам, но не инвариантны к поворотам и изменению

Сети инварианты к сдвигам, но не инвариантны к поворотам и изменению

масштаба.

Q: Как сделать сети инвариантными к
поворотам и изменению масштаба?

Использовать Data Augmentation.

Слайд 10

Изменение позиций компонентов объекта относительно друг друга Source: https://medium.com/ai³-theory-practice-business/understanding-hintons-capsule-networks-part-i-intuition-b4b559d1159b

Изменение позиций компонентов
объекта относительно друг друга

Source: https://medium.com/ai³-theory-practice-business/understanding-hintons-capsule-networks-part-i-intuition-b4b559d1159b

Слайд 11

Идея: Давайте прикрутим еще одну сеть, которая будет учиться трансформировать изображение

Идея:
Давайте прикрутим еще одну сеть, которая будет учиться трансформировать изображение таким

образом, чтобы минимизировать ошибку классификации.
Суть:
Такой подход позволяет сделать сеть асимптотически инвариантной к поворотам и изменению масштаба.
Слайд 12

Source: http://papers.nips.cc/paper/5854-spatial-transformer-networks.pdf

Source: http://papers.nips.cc/paper/5854-spatial-transformer-networks.pdf

Слайд 13

Source: http://papers.nips.cc/paper/5854-spatial-transformer-networks.pdf

Source: http://papers.nips.cc/paper/5854-spatial-transformer-networks.pdf

Слайд 14

H W C

 

H

W

C

Слайд 15

Для каждого пикселя в выходном изображении мы получаем координаты пикселя во

Для каждого пикселя в выходном изображении мы получаем координаты пикселя во

входном изображении, которые нам понадобятся на следующем шаге.
Слайд 16

 

Слайд 17

Source: http://papers.nips.cc/paper/5854-spatial-transformer-networks.pdf

Source: http://papers.nips.cc/paper/5854-spatial-transformer-networks.pdf

Слайд 18

Source: https://habrahabr.ru/company/newprolab/blog/339484/

Source: https://habrahabr.ru/company/newprolab/blog/339484/

Слайд 19

Q: Что можно делать с помощью ST? поворачивать обрезать повышать/понижать размерность

Q: Что можно делать с помощью ST?

поворачивать
обрезать
повышать/понижать размерность

Q: Что самое приятное

в ST

То, что сеть сама поймет что и как ей делать. Все учится end-to-end без дополнительных функций потерь и т.п.

Слайд 20

Что если мы хотим, чтобы сеть в классификации опиралась не только

Что если мы хотим, чтобы сеть в классификации опиралась не только

на присутствие компонентов какого-либо объекта, но и использовала информацию о взаимном расположении этих компонентов?

Source: https://medium.com/ai³-theory-practice-business/understanding-hintons-capsule-networks-part-i-intuition-b4b559d1159b

Слайд 21

Капсула – группа нейронов, чей вектор характеризует: Уверенность сети в том,

Капсула – группа нейронов, чей вектор характеризует:
Уверенность сети в том, что

объект (или его часть) присутствует в какой-то части картинки.
Параметры расположения этого объекта относительно других объектов.
Параметры освещения, деформации, поворота и т.п.
Вообще, капсулы можно делать по-разному, но мы посмотрим на то, как это делает Geoffrey Hinton в оригинальной статье.
Слайд 22

 

Слайд 23

Такая нелинейность приводит очень длинный вектор к длине около 1, а

 

Такая нелинейность приводит очень длинный вектор к длине около 1, а

очень маленький к длине около 0.
Слайд 24

 

Слайд 25

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Слайд 26

Давайте разберемся что это значит!

Давайте разберемся что это значит!

Слайд 27

Source: https://medium.com/ai³-theory-practice-business/understanding-hintons-capsule-networks-part-i-intuition-b4b559d1159b

Source: https://medium.com/ai³-theory-practice-business/understanding-hintons-capsule-networks-part-i-intuition-b4b559d1159b

Слайд 28

Все учится backprop’ом. Dynamic routing делается только во время forward prop’а. Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Все учится backprop’ом.
Dynamic routing делается только во время forward prop’а.

Source:

http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf
Слайд 29

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Слайд 30

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Слайд 31

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Слайд 32

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Source: http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf

Слайд 33

У сверток есть недостатки Они не инвариантны к поворотам Они не

У сверток есть недостатки
Они не инвариантны к поворотам
Они не инвариантны к

изменению масштаба
Они плохо справляются с изменением взаимных позиций компонентов объекта
Слайд 34

Spatial Transformer дает инвариантность к поворотам и изменению масштаба. А также,

Spatial Transformer дает инвариантность к поворотам и изменению масштаба. А также,

позволяет дифференцируемо обрезать, растягивать и вращать изображения.
Слайд 35

Capsule Network помогает справится с проблемой изменения взаимных позиций компонентов объекта.

Capsule Network помогает справится с проблемой изменения взаимных позиций компонентов объекта.

Еще капсулы получают очень хорошие и иногда даже интерпретируемые репрезентации изображений.