Планирование уроков на учебный год (по учебнику Н.Д. Угриновича, профильный уровень)



Уроки 48 - 49
§2.3. Системы оптического распознавания символов




Содержание урока

Оптическое распознавание символов

Алгоритмы оптического распознавания

Оптическое распознавание документов

Оптическое распознавание изображений

Мультиязычность систем оптического распознавания

Системы оптического распознавания форм

Системы распознавания рукописного текста

Контрольные вопросы

Практическая работа 2.7 Оптическое распознавание документов в формате изображений


Алгоритмы оптического распознавания


Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то распознавание осуществляется методом сравнения с шаблонами символов. Сначала растровое изображение страницы разделяется на изображения отдельных символов. Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством точек, отличных от входного изображения.

При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.) используется метод распознавания символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.). Любой символ можно описать через набор параметров, определяющих взаимное расположение его элементов. Например, буква Н и буква И состоят из трех отрезков, два из которых расположены параллельно друг другу, а третий соединяет эти отрезки. Различие между буквами состоит в величине углов, которые образует третий отрезок с двумя другими. При распознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего соответствует распознаваемому символу.

Наиболее распространенные системы оптического распознавания символов используют как растровый, так и структурный метод распознавания. Кроме того, эти системы являются «обучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов), и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

Следующая страница Оптическое распознавание документов



Cкачать материалы урока






Наверх