Оптическое распознавание символов

Содержание

Слайд 2

Оптическое распознавание - это механический или электронный перевод изображений рукописного, машинописного

Оптическое распознавание

- это механический или электронный перевод изображений рукописного, машинописного

или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе.
Слайд 3

Плюсы Перевод в текстовый вид очень сложных текстовых документов, включая таблицы,

Плюсы

Перевод в текстовый вид очень сложных текстовых документов, включая таблицы, формы,

диаграммы, рисунки
Проверка орфографии
Сохранение файла в любом текстовом формате, а также в форматах электронных таблиц и баз данных
Слайд 4

OCR - optical character recognition (оптическое распознавание символов)

OCR

- optical character recognition (оптическое распознавание символов)

Слайд 5

История OCR Программы появились сначала в США, а затем, и в

История OCR

Программы появились сначала в США, а затем, и в

России. OCR - optical character recognition (оптическое распознавание символов)
1978 год - компания «Курцвейл Компьютер Продактс» начала продажи коммерческой версии компьютерной программы оптического распознавания символов
Слайд 6

Программы OCR Recognita Plus DTK фирмы Recognita Corporation †, Венгрия TextBridge

Программы OCR

Recognita Plus DTK фирмы Recognita Corporation †, Венгрия
TextBridge фирмы

†Xerox Imaging Systems
TypeReader фирмы ExperVision †, США
СharacterEyes фирмы Ligature, Израиль
IRIS OCR фирмы I.R.I.S.,Бельгия
Easy Reader фирмы† Inovatic International, Франция
WordScan Plus и OmniPage Professional †фирмы Caera, США
Слайд 7

Системы OCR в России OCR CuneiForm; † † ABBYY FineReader

Системы OCR в России
OCR CuneiForm; †
† ABBYY FineReader

Слайд 8

Этапы преобразования документа в электронный вид OCR-системами Сканирование и предварительная обработка

Этапы преобразования документа в электронный вид OCR-системами

Сканирование и предварительная обработка

изображения
Анализ структуры документа
Распознавание
Проверка результатов
Реконструкция документа (воссоздание его исходного вида)
Экспорт
Слайд 9

Описание OCR-процедуры Предварительная обработка изображения Распознавание объектов высших уровней. Бинаризация Распознавание

Описание OCR-процедуры

Предварительная обработка изображения
Распознавание объектов высших уровней. Бинаризация
Распознавание символов
Структурирование гипотез. Словарная

проверка
Синтез электронного документа
Слайд 10

Базовые принципы технологий распознания текста Принципы IPA: Целостность (integrity) Целенаправленность (purposefulness) Адаптивность (Adaptability) Многоуровневый анализ документа

Базовые принципы технологий распознания текста

Принципы IPA:
Целостность (integrity)
Целенаправленность (purposefulness)
Адаптивность (Adaptability)
Многоуровневый анализ документа

Слайд 11

Принципы IPA Согласно принципу целостности (integrity), созерцаемый объект рассматривается как целое, состоящее из связанных частей

Принципы IPA

Согласно принципу целостности (integrity), созерцаемый объект рассматривается как целое, состоящее

из связанных частей
Слайд 12

Принципы IPA Принцип целенаправленности (purposefulness) - любая интерпретация данных преследует определенную

Принципы IPA

Принцип целенаправленности (purposefulness) - любая интерпретация данных преследует определенную цель.

Согласно этому принципу, распознавание представляет собой процесс выдвижения гипотез о целом объекте и целенаправленной их проверки
Слайд 13

Принципы IPA Принцип адаптивности (adaptability) подразумевает способность системы к самообучению.

Принципы IPA

Принцип адаптивности (adaptability) подразумевает способность системы к самообучению.