Оптическое распознавание символов
Алгоритмы оптического распознавания
Оптическое распознавание документов
Оптическое распознавание изображений
Мультиязычность систем оптического распознавания
Системы оптического распознавания форм
Системы распознавания рукописного текста
Практическая работа 2.7 Оптическое распознавание документов в формате изображений
При заполнении налоговых деклараций, при проведении переписей населения и т. д. используются различного вида бланки с полями. Рукопечатные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.
Сложность состоит в том, что необходимо распознавать написанные от руки символы, довольно сильно различающиеся у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст.
CRFeeder — программа, предоставляющая графический интерфейс пользователя для систем оптического распознавания символов CuneiForm, Tesseract, GOCR (англ.) и Ocrad (англ.). OCRFeeder является свободно распространяемой программой для операционной системы Linux.
Лицензия - GNU GPL. GNU General Public License (переводят как Универсальная общественная лицензия GNU, Универсальная общедоступная лицензия GNU или Открытое лицензионное соглашение GNU) — лицензия на свободное программное обеспечение, созданная в рамках проекта GNU в 1988 г., по которой автор передаёт программное обеспечение в общественную собственность.
Следующая страница Системы распознавания рукописного текста