Системы оптического распознавания документов
Практическая работа 2.7
Лабораторная работа № 13 «Учимся сканировать и распознавать текст»
Аппаратное и программное обеспечение. Компьютер с установленной операционной системой Windows или Linux и подключенный сканер.
Цель работы. Научиться сканировать «бумажные» тексты и преобразовывать их в компьютерные текстовые документы с помощью систем оптического распознавания.
Задание. Отсканировать и преобразовать в компьютерный текстовый документ страницу учебника.
Задание. Сканирование и распознавание «бумажного» текстового документа
1. Произвести сканирование текстового документа и сохранить его в виде графического файла.
2. В операционной системе Windows или Linux запустить систему распознавания символов CuneiForm. Загрузить в окно этой системы графический файл отсканированного текстового документа.
3. В окне системы оптического распознавания появится отсканированное изображение текстовой страницы. Для преобразования графического изображения страницы в текстовый файл сначала выбрать область распознавания командой [Распознавание-Область распознавания] и в окне системы распознавания выделить область.
4. Ввести команду [Распознавание-Распознавание]: начнется процесс распознавания, в результате которого в окне появится текстовый документ.
5. После окончания процесса распознавания ввести команду [Файл-Сохранитъ текст как...], в появившемся диалоговом окне выбрать место сохранения и имя полученного текстового файла.
6. Открыть полученный документ в текстовом редакторе и исправить возможные ошибки, допущенные в процессе распознавания.