Содержание
- 2. Дисклеймер В данной презентации использованы изображения паспортов, взятые в открытых источниках, я не имею цели раскрыть
- 3. О чем поговорим? проблема поиска полей на паспорте; задачи компьютерного зрения; Mask R-CNN и особенности архитектуры
- 4. Проблема Большой поток данных, который обрабатывается вручную.
- 5. Извлечение фактов из паспорта
- 6. Извлечение фактов из паспорта
- 7. Извлечение фактов из паспорта
- 8. Извлечение фактов из паспорта
- 9. Нейронные сети
- 10. Задачи компьютерного зрения
- 11. Задачи компьютерного зрения
- 12. Проблемы Object Detection
- 13. Проблемы Semantic Segmentation
- 14. Поиск объектов на изображениях
- 15. Где еще можно применить
- 16. Faster R-CNN FCN (FPN) Mask R-CNN
- 17. Convolutional layers
- 18. Feature maps
- 19. Feature maps
- 20. Region Proposal Network (RPN)
- 21. Region Proposal Network
- 22. RPN Predictions
- 23. Classifier and RoI pooling
- 24. Roi Pooling
- 25. Roi Pooling
- 26. RoiAlign
- 27. Классификация и выравнивание рамок
- 28. FPN
- 29. Генерация масок
- 30. Что получилось
- 31. Что получилось
- 32. Метрики
- 33. F1-мера
- 34. Результат f1-мера ~70% Не намного лучше, чем раньше
- 35. Аугментации
- 36. Аугментации
- 37. Синтетические данные
- 38. Результат F1-мера чуть больше 90% Оборачиваем в сервис и встраиваем
- 39. Плюсы большая точность; Instance Segmentation; обучена на coco датасете (может находить людей, машины, собак, кошек, пончики
- 40. Минусы долгое обучение (6 ч. на 8 GB GPU); работает дольше других сетей (3-4 сек. CPU,
- 43. Скачать презентацию