Mask R-CNN: извлечение данных из паспортов

Содержание

Слайд 2

Дисклеймер В данной презентации использованы изображения паспортов, взятые в открытых источниках,

Дисклеймер

В данной презентации использованы изображения паспортов, взятые в открытых источниках, я

не имею цели раскрыть чьи-либо персональные данные.
Слайд 3

О чем поговорим? проблема поиска полей на паспорте; задачи компьютерного зрения;

О чем поговорим?

проблема поиска полей на паспорте;
задачи компьютерного зрения;
Mask R-CNN и

особенности архитектуры на примерах;
повышение качества;
итоги.
Слайд 4

Проблема Большой поток данных, который обрабатывается вручную.

Проблема

Большой поток данных, который обрабатывается вручную.

Слайд 5

Извлечение фактов из паспорта

Извлечение фактов из паспорта

Слайд 6

Извлечение фактов из паспорта

Извлечение фактов из паспорта

Слайд 7

Извлечение фактов из паспорта

Извлечение фактов из паспорта

Слайд 8

Извлечение фактов из паспорта

Извлечение фактов из паспорта

Слайд 9

Нейронные сети

Нейронные сети

Слайд 10

Задачи компьютерного зрения

Задачи компьютерного зрения

Слайд 11

Задачи компьютерного зрения

Задачи компьютерного зрения

Слайд 12

Проблемы Object Detection

Проблемы Object Detection

Слайд 13

Проблемы Semantic Segmentation

Проблемы Semantic Segmentation

Слайд 14

Поиск объектов на изображениях

Поиск объектов на изображениях

Слайд 15

Где еще можно применить

Где еще можно применить

Слайд 16

Faster R-CNN FCN (FPN) Mask R-CNN

Faster R-CNN FCN (FPN)

Mask R-CNN

Слайд 17

Convolutional layers

Convolutional layers

Слайд 18

Feature maps

Feature maps

Слайд 19

Feature maps

Feature maps

Слайд 20

Region Proposal Network (RPN)

Region Proposal Network (RPN)

Слайд 21

Region Proposal Network

Region Proposal Network

Слайд 22

RPN Predictions

RPN Predictions

Слайд 23

Classifier and RoI pooling

Classifier and RoI pooling

Слайд 24

Roi Pooling

Roi Pooling

Слайд 25

Roi Pooling

Roi Pooling

Слайд 26

RoiAlign

RoiAlign

Слайд 27

Классификация и выравнивание рамок

Классификация и выравнивание рамок

Слайд 28

FPN

FPN

Слайд 29

Генерация масок

Генерация масок

Слайд 30

Что получилось

Что получилось

Слайд 31

Что получилось

Что получилось

Слайд 32

Метрики

Метрики

Слайд 33

F1-мера

F1-мера

Слайд 34

Результат f1-мера ~70% Не намного лучше, чем раньше

Результат

f1-мера ~70%

Не намного лучше,
чем раньше

Слайд 35

Аугментации

Аугментации

Слайд 36

Аугментации

Аугментации

Слайд 37

Синтетические данные

Синтетические данные

Слайд 38

Результат F1-мера чуть больше 90% Оборачиваем в сервис и встраиваем

Результат

F1-мера чуть больше 90%
Оборачиваем в сервис и встраиваем

Слайд 39

Плюсы большая точность; Instance Segmentation; обучена на coco датасете (может находить

Плюсы

большая точность;
Instance Segmentation;
обучена на coco датасете (может находить людей, машины, собак,

кошек, пончики и многое другое);
можно взять и дообучить.
Слайд 40

Минусы долгое обучение (6 ч. на 8 GB GPU); работает дольше

Минусы

долгое обучение (6 ч. на 8 GB GPU);
работает дольше других сетей

(3-4 сек. CPU, 0.4-0.5 сек. на GPU);
тяжелые модели (требуется > 5 GB).
Слайд 41