Содержание | Сканеры

Сканеры

Цифровая обработка изображений (digital imaging) сейчас распространилась очень широко. Оборудование, которое раньше было по карману только богатым организациям, сейчас находится на рабочих столах множества людей. Мощные РС, которые раньше требовались для обработки изображений, теперь считаются компьютерами для начинающих. Сейчас значительную долю рынка устройств, предназначенных для обработки изображений, занимают сканеры (scanners), которые предназначены для ввода изображений в РС.

С общей точки зрения сканер представляет собой устройство ввода наподобие мыши и клавиатуры, но он воспринимает ввод в графической форме. Вводимыми изображениями могут быть фотографии для ретуширования, коррекции и использования в настольном издательстве. Ими могут быть нарисованные вручную логотипы, используемые для "шапок" документов. Наконец, изображения могут быть страницами текста, которые соответствующая программа может считать и сохранить как редактируемый текстовый файл.

Список применений сканеров почти бесконечен, что привело к разработке и выпуску устройств, отвечающих конкретным требованиям:

Высококачественные барабанные сканеры, способные считывать бумажные документы и пленки от 35 мм слайдов до огромных пленок с высокой разрешающей способностью свыше 10 000 dpi.
Компактные сканеры документов, предназначенные для оптического распознавания символов (Optical Character Recognition - OCR) и управления документами.
Специализированные фотосканеры, которые работают, перемещая фотографию над стационарным источником света.
Сканеры слайдов и пленок, которые работают, пропуская свет через изображение, а не отражая свет от него.
Ручные сканеры для пользователей с ограниченным бюджетом или имеющих рабочей стол небольших размеров.

Наиболее широко распространены универсальные планшетные сканеры (flatbed scanners). Они обеспечивают ввод цветных рисунков, документов, страниц из книг и журналов, а при наличии специальных приставок могут сканировавть прозрачную фотопленку.

Принципы работы сканера

В самом простом понимании сканер представляет собой устройство, которое преобразует свет (который мы видим, разглядывая что-то) в единицы и нули компьютерного формата. Другими словами, сканеры преобразуют аналоговые данные в цифровые.

Работа всех сканеров опирается на принцип отражения (reflectance) или прохождения (transmission). Изображение помещается перед кареткой (carriage), состоящей из источника света и датчика; в случае цифровой камеры (digital camera) источником света может быть солнце или искусственное освещение. Когда впервые появились настольные сканеры, во многих из них источником света служили флюоресцентные трубки. Эти трубки во многих случаях очень удобны, но у них есть два недостатка: они редко излучают однородный белый свет продолжительное время и при работе нагреваются, а тепло вызывает искажение других оптических компонентов. Поэтому большинство производителей перешло на трубки с холодным катодом. Они отличаются от стандартных флюоресцентных трубок тем, что не имеют накала. В результате трубки с холодным катодом работают при намного меньших температурах и, как следствие, более надежны. Стандартные флюоресцентные трубки сейчас можно встретить только в самых дешевых сканерах.

В конце 2000 г. как альтернативный источник света стали применяться ксеноновые лампы. Такие лампы оказались очень стабильным источником света с широким спектром; ксеноновые лампы долговечны и быстро "зажигаются". Однако они потребляют большую мощность по сравнению с трубками с холодным катодом.

Для направления света от трубки на датчики, которые считывают значения света (этими датчиками являются CCD-элементы), в сканерах используются призмы, линзы и другие оптические компоненты. Как очки и увеличительные стекла, эти компоненты значительно варьируются по качеству. В высококачественных сканерах применяется дорогая стеклянная оптика с цветовой коррекцией и специальным покрытием для минимизации диффузии. В дешевых сканерах обычно применяются более простые пластиковые компоненты.

Объем света, отраженного от изображения или прошедшего через изображение и воспринятого датчиком, преобразуется в напряжение, пропорциональное интенсивности света - чем ярче часть изображения, тем больше света отражается или проходит, вызывая появление более высокого напряжения. Такое аналого-цифровое преобразование оказывается очень чувствительным к электрическим наводкам и помехам. Чтобы предотвратить ухудшение изображений в лучших сканерах используется электрически изолированный аналого-цифровой преобразователь (Analog-to-Digital Converter - ADC), который обрабатывает данные вне основных схем сканера. Однако при этом повышается стоимость сканера, поэтому во многих дешевых моделях применяются ADC, расположенные на основной схемной плате сканера.

Собственно датчики выполняются по одной из трех технологий:

Фотоумножитель (PhotoMultiplier Tube): Такие датчики унаследованы от старых барабанных сканеров.
Прибор с зарядовой связью (Charge-Coupled Device): CCD-датчики применяются в настольных сканерах.
Контактный датчик изображения (Contact Image Sensor - CIS: Новейшая технология, которая интегрирует функции сканирования в меньшее число компонентов, что позволяет выпускать более компактные сканеры.

Фотоумножитель

Фотоумножители использовались в высококачественных барабанных сканерах крупных издательских компаний. Эти дорогие и сложные в эксплуатации устройства применялись для ввода изображений в компьютеры до появления настольных сканеров. Техники должны были тщательно размещать оригиналы на стеклянном цилиндре, который затем с высокой скоростью вращался вокруг датчика, расположенного в центре.

В сканере свет разделялся на три луча с помощью трех фильтров красного, зеленого и синего цвета и эти лучи подавались на три фотоумножителя, в которых световая энергия преобразовывалась в электрический сигнал. Фотоумножители имеют значительно более высокую чувствительность и меньшие уровни шумов, чем CCD. Поэтому барабанные сканеры обладают прекрасной тональной разрешающей способностью и менее подвержены ошибкам из-за рефракции или фокусировки, чем планшетные сканеры.

Однако барабанные сканеры медленнее по сравнению с CCD-сканерами и довольно дорогие. Сейчас они применяются только для специальных приложений, требующих высококачественного ввода изображений.

Прибор с зарядовой связью

CCD-технология, превратившая сканирование в настольно приложение, уже несколько лет использовалась в факс-машинах и цифровых камерах. Прибор с зарядовой связью (Charge-Coupled Device - CCD) представляет собой полупроводниковый прибор, который преобразует свет в электрический заряд. Датчик настольного сканера обычно имеет тысячи CCD-элементов в виде длинной и узкой линейки. Отраженный или прошедший свет пропускается через красный, зеленый и синий фильтры и направляется с помощью системы зеркал и линз на массив CCD-элементов. CCD-элемент действует как фотометр, преобразуя воспринятый свет в аналоговое напряжение, которое аналого-цифровой преобразователь превращает в цифровое значение.

Контактный датчик изображения

Контактные датчики изображения (Contact Image Sensor - CIS) стали применяться в недорогих планшетных сканерах в конце 90-х годов прошлого века. В CIS-сканерах используются компактные блоки красных, зеленых и синих светодиодов для получения белого света, а зеркала и линзы CCD-сканера заменены одной линейкой датчиков, размещенных очень близко к источнику изображения. В результате получился плоский и легкий сканер, который потребляет меньшую мощность и оказывается дешевле традиционных сканеров с CCD-датчиками. Однако качество введенных изображений пока уступает традиционным сканерам.

Технология датчика является не единственным фактором, который определяет качественные показатели сканера. Есть еще три очень важные характеристики сканера: разрешающая способность (resolution), битовая глубина (bit depth) и динамический диапазон (dynamic range).

Разрешающая способность

Разрешающая способность, или просто разрешение (resolution) показывает "тонкость" деталей, которую может обеспечить сканер, и обычно измеряется числом точек на дюйм (dots per inch - dpi). Чем больше точек на дюйм может воспринять сканер, тем более детальным будет результирующее изображение. Типичная разрешающая способность недорогого настольного сканера составляет 300х300 dpi.

Типичный планшетный сканер имеет CCD-элемент для каждого пиксела. Поэтому в настольном сканере с горизонтальной оптической разрешающей способностью 600 dpi, называемой также 600 ppi (pixels per inch - пикселов на дюйм), и при максимальной ширине документа 8.5" имеется линейка из 5100 CCD-элементов, которая называется сканирующей головкой (scan head).

Сканирующая головка смонтирована на транспорте, который движется вдоль документа. Несмотря на то, что зрительно движение воспринимается как непрерывное, головка перемещается дискретными шагами на незначительное расстояние и производит отсчеты. В планшетном сканере головку перемещает шаговый двигатель (stepper motor), ось которого поворачивается на фиксированный угол при подаче в статорную обмотку электрического импульса.

Число физических элементов в линейке CCD-элементов определяет частоту дискретизации по оси X, а число "остановок" на дюйм определяет частоту дискретизации по оси Y. Несмотря на то, что эти параметры удобно считать разрешающей способностью (resolution), это не совсем точно. Разрешающая способность есть способность сканера различать детальность объекта и она определяется качеством электроники, оптики, фильтров и управления двигателем, а также частотой дискретизации.

Реальная сканирующая головка, хотя и способная считывать строку растра (raster line) шириной 8.5", на самом деле меньше этого размера и обычно ее ширина составляет около 4" (10 см). Отраженный свет направляется на сканирующую головку через линзы и качество оптики может влиять на разрешающую способность сильнее, чем частота дискретизации. Высококачественная оптика в сканере с 400 dpi обеспечивает лучшие результаты, чем сканер с 600 dpi, но с плохой оптикой.

К концу 1998 г. физический предел числа CCD-элементов, которые можно расположить рядом на одном дюйме, составлял 600 элементов. Однако можно повысить кажущуюся разрешающую способность, применяя интерполирование (interpolation), в котором с помощью аппаратных и программных средств определяются промежуточные значения и вставляются между реальными. Некоторые сканеры производят интерполирование эффективнее других.

Интерполяция

В проспектах для сканеров указывается разрешающая способность в 2400 dpi, 4800 dpi и даже 9600 dpi. Важно понимать, что сканеры просто не могут обеспечить такой уровень детальности. Фактическая оптическая разрешающая способность CCD-элементов в большинстве современных сканеров в лучшем случае составляет 600x1200 dpi, а все большие значения основаны на интерполяции.

Отметим, что спецификация неоднородной разрешающей способности, например 600x1200 dpi, необязательно подразумевает аппаратную интерполяцию, так как получение данных с 600 dpi по одной оси и 1200 dpi по другой оси не может дать "квадрат" данных. При разрешающей способности 600x600 dpi такой сканер будет интерполировать размерность 1200 dpi до 600 dpi (обычно заставляя работать шаговый двигатель, который перемещает световую полоску, с удвоенной минимальной скоростью), а при 1200x1200 dpi будет интерполироваться размерность X. Обычно специализированная микросхема в сканере формирует новые данные, воспринимая точки, которые действительно "видит" сканер, и вычисляя промежуточные точки с использованием алгоритма вычисления цвета новых точек путем усреднения цвета соседних точек.

Программная интерполяция может повысить разрешающую способность даже сильнее, чем аппаратная интерполяция. Ее реализует процессор РС по управлением программы TWAIN-драйвера сканера. Проблема заключается в том, что даже лучшие предположения не могут быть абсолютно точными. Интерполированное изображение всегда кажется сглаженным и несколько расфокусированным. Такой дефект не играет роли для штриховых рисунков, где интерполяция сглаживает ступенчатые края. Однако для многоградационных изображений, например фотографий, часто лучше оставить фактическую оптическую разрешающую способность сканера.

Цветные сканеры

Цветные сканеры имеют три источника света - для красного, зеленого и синего первичных цветов. Некоторые сканирующие головки содержат одну флюоресцентную трубку и три CCD-элемента с фильтрами, а другие содержат три цветных трубки и один CCD-элемент. Сканеры первого типа формируют все цветное изображение за один проход, причем документ освещается тремя быстрыми вспышками, а в сканерах второго типа требуются три прохода.

В однопроходовых сканерах возникали проблемы с устойчивостью световых уровней при быстром включении и выключении. Старые трехпроходовые сканеры работали очень медленно. Более новые трехпроходовые сканеры были усовершенствованы и по скорости не уступали однопроходовым. Тем не менее, к концу 90-х годов прошлого века большинство сканеров были однопроходовыми устройствами.

В этих сканерах применяется один их двух методов считывания значений света: расщепитель луча или покрытые CCD-элементы. При использовании расщепителя луча свет проходит через призму и разделяется на три первичных сканирующих цвета, каждый из которых считывается отдельными CCD-элементами. Этот метод считается лучшим способом обработки отраженного света, но ради снижения стоимости многие производители используют три линейки CCD-элементов, каждая из которых покрыта пленкой и считывает только один из первичных сканирующих цветов от нерасщепленного луча. Обычно второй метод дает такие результаты, которые трудно отличить от результатов сканера с расщепителем луча.

Битовая глубина

Когда сканер преобразует документ в цифровую форму, он воспринимает изображение пиксел за пикселом и регистрирует то, что воспринимает. Этот этап процесса сканирования довольно простой, но различные сканеры регистрируют разные объемы информации о каждом пикселе. Объем регистрируемой сканером информации измеряется битовой глубиной (bit-depth).

Простейший сканер регистрирует только черное и белое и иногда называется 1-битовым сканером. Чтобы воспринять множество оттенков между черным и белым, сканер должен быть 4-битовым (до 16 оттенков) или 8-битовым (до 256 оттенков). Чем выше битовая глубина сканера, тем точнее он может описать восприятие конкретного пиксела, а это повышает качество сканирования.

Большинство современных сканеров являются 24-битовыми, т.е. они регистрируют восемь битов информации о каждом из первичных сканирующих цветов: красном, зеленом и синем. 24-битовый сканер может теоретически воспринять более 16.7 млн различных цветов, хотя на практике это число намного меньше. Такое почти фотографическое качество часто называется "истинно цветным" (true colour) сканированием.

Сейчас все большее число производителей предлагают 30- и 36-битовые сканеры, которые теоретически могут воспринимать миллиарды цветов. Однако очень мало программ графических редакторов могут обрабатывать изображения с битовой глубиной больше 24 из-за ограничений аппаратных средств РС. Однако дополнительные биты иметь полезно. Когда программа 30- или 36-битовое изображение, она может использовать дополнительные данные для коррекции помех процесса сканирования и решения других проблем, которые ухудшают качество сканирования. В результате сканеры с большей битовой глубиной позволяют получить более качественные цветные изображения.

Динамический диапазон

Динамический диапазон (dynamic range) похож на битовую глубину тем, что он измеряет, насколько широк диапазон оттенков, который может зарегистрировать сканер. Он зависит от аналого-цифрового преобразователя сканера, чистоты освещающего света, цветовых фильтров и существующих в любой системе помех.

Динамический диапазон измеряется на шкале от 0.0 (совершенный белый) до 4.0 (совершенный черный) и конкретное число для каждого сканера показывает, какую часть этого диапазона может различать устройство. Большинство цветных планшетных сканеров плохо воспринимают тонкие различия между темными и светлыми цветами с любой стороны диапазона и имеют динамический диапазон около 2.4. Такого диапазона обычно вполне достаточно для тех ситуаций, когда совершенный цвет не нужен. Более широкий динамический диапазон обеспечивают высококачественные цветные планшетные сканеры с повышенной битовой глубиной и более совершенной оптикой. Такие сканеры имею динамический диапазон от 2.8 до 3.2, которого достаточно для цветной пробной печати. Еще более повысить динамический диапазон позволяет барабанный сканер, обычно имеющий динамический диапазон от 3.0 до 3.8 и предоставляющий такое качество цвета, какое может обеспечить настольный сканер. Конечно, высокое качество достигается "в обмен" на высокую стоимость.

Теоретически 24-битовый сканер имеет 8-битовый диапазон (256 уровней) для каждого первичного цвета - разница между соседними уровнями неразличима человеческим глазом. К сожалению, несколько младших битов теряются из-за помех, а любые коррекции оттенков после сканирования еще больше уменьшают динамический диапазон. Поэтому лучше всего производить коррекцию яркости и цвета в драйвере сканера до производства собственно сканирования. Более дорогие сканеры с 30- или 36-битовой глубиной имеют более широкий диапазон, предоставляя лучшую детальность теневых и освещенных областей, что позволяет выполнить коррекции оттенков и получить в результате 24 бита. 30-битовый сканер фиксирует по 10 битов для красного, зеленого и синего цветовых компонентов, 36-битовый сканер фиксирует по 12 битов. Драйвер сканера позволяет оператору управлять тем, какие 24 из 30 или 36 битов оставить, а какие удалить. Такая коррекция выполняется изменением Gamma Curve, доступ к которой предоставляет элемент управления Tonal Adjustment TWAIN-драйвера.

Разрешающая способность сканирования

До сканирования любого изображения необходимо определить, с какой разрешающей способностью его сканировать. Поскольку современная реклама приучила нас к правилу "чем больше, тем лучше", нетрудно понять, почему большинство пользователей стремится производить сканирование со слишком высокой разрешающей способностью. Разрешающая способность сканирования должна всегда определяться возможностями устройства вывода и на практике редко требуется сканировать с разрешающей способностью выше 240 dpi.

При печати изображений для воспроизведения различных уровней цвета часто используются полутона (halftoning). В журналах применяются упорядоченные полутона, когда регулярные точки разных размеров воспроизводят переменные уровни цвета. В большинстве струйных принтеров используется клиширование (dithering), когда точки "разбрасываются" по области каждого пиксела. При малой разрешающей способности клиширование обеспечивает лучшие результаты. Применение полутонов означает, что число пикселов на дюйм, которое может воспроизводить принтер, оказывается меньше указываемой для принтера разрешающей способности в 'dpi'.

Для печати 24-битовых изображений можно придерживаться такого простого правила: число пикселов на дюйм должно быть в 16 раз меньше разрешающей способности. Это означает, что для принтера с 600 dpi достаточно разрешающей способности сканирования в 40 пикселов на дюйм. Имиджсеттеры (imagesetter), которые применяются в офсетной печати могут печатать 133 строки на дюйм. Технология офсетной печати не похожа на технологию печати струйных и лазерных принтеров, поэтому здесь рекомендуется сканировать с разрешающей способностью, которая в 1.5 раза выше разрешающей способности печати, что дает 200 dpi.

При сканировании для печати на струйном принтере рекомендуется сканировать с разрешающей способностью, равной 1/3 разрешающей способности печати. Если типичный современный струйный принтер имеет максимальную разрешающую способность 720 dpi, то достаточно разрешающей способности сканирования в 240 dpi. Однако печатать с максимальной разрешающей способностью принтера на обычной белой бумаге не рекомендуется; в этом случае обычно достаточно разрешающей способности печати в 360 dpi, поэтому разрешающая способность сканирования составляет всего 120 dpi. Если сканирование производится в шкале серого или штриховыми рисунками, лучше использовать полную разрешающую способность принтера без деления ее на три.

При сканировании изображений для Web-страниц или прямого отображения на мониторе РС, разрешающая способность сканирования выбирается в зависимости от требуемого размера отображаемого изображения. Графические карты имеют различные режимы отображения, например 640x480, 800x600, 1024x768 и др., а экраны мониторов имеют различные размеры. Однако в самом простом варианте изображения для последующего отображения на мониторе РС должны сканироваться с разрешающей способностью примерно 72 dpi.

Режимы сканирования

РС представляют рисунки несколькими способами и наиболее распространенными являются штриховые рисунки (line art), полутона (halftone), шкала серого (greyscale) и цвет:

Штриховые рисунки являются простейшими из всех форматов изображений. Поскольку сохраняется только информация о черном и белом, компьютер может представить черное 1, а белое 0. В сканированном черно-белом изображении для каждой точки достаточно всего одного бита. Штриховые рисунки полезны только при сканировании текста и чертежей.
Хотя РС могут хранить и показывать изображения в шкале серого, большинство принтеров не способно печатать различные оттенки серого. В них используется прием, называемый полутоновой печатью (halftoning). Здесь для "обмана" глаза, как бы воспринимающего информацию в шкале серого, используются узоры из точек.
Изображения в шкале серого являются простейшими изображениями, которые может хранить РС. Человек может воспринимать около 255 различных оттенков серого, которые можно представить в РС одним байтом со значениями от 0 до 255. Изображение в шкале серого можно считать эквивалентом черно-белой фотографии.
Истинно цветные (true colour) изображения являются самыми большими по размеру и сложными изображениями. РС использует 8 битов (один байт) для представления каждого цветового компонента (красного, зеленого и синего), поэтому для представления всего цветного спектра требуется 24 бита.

Форматы файлов

Формат, в котором сохраняется сканированное изображение, сильно влияет на размер файла. Размер файла важен при сканировании, так как при высокой разрешающей способности современных сканеров размер файла для страницы формата А4 может достигать 30 МБ.

Растровые (bitmap) файлы BMP операционной системы Windows - самые большие, так как цветные изображения сохраняются без сжатия, а для 256-цветных изображений применяется простой алгоритм кодирования длинами отрезков (Run-Length Encoding - RLE). В формате BMP хранятся файлы для обоев Windows, но в большинстве случаев его следует избегать.

Формат тэгированных файлов изображений (Tagged Image File Format - TIFF) наиболее гибок, так как позволяет сохранить изображения в RGB-режиме для дисплея или CMYK-режиме для печати. Этот формат поддерживает LZW-сжатие (Lempel-Ziv-Welch), позволяющее значительно сократить размер файла без потери качества. Алгоритм LZ77 создает указатели на повторяющиеся данные, а алгоритм LZ78 создает словарь повторяющихся фраз с указателями на эти фразы.

Формат обмена графикой (Graphics Interchange Format - GIF) сохраняет изображения с использованием индексированного цвета. В каждом изображении доступны 256 цветов, но их можно изменять для каждого изображения. Таблица RGB-значений для каждого индексированного цвета хранится в начале файла изображения. GIF-файлы имеют небольшой размер по сравнению с другими форматами за счет уменьшения глубины цвета, что сделало их популярными для WWW-публикаций.

Формат PCX для Paintbrush почти не применяется, но обеспечивает сжатый формат с 24-битовой глубиной цвета. Формат файлов JPEG рассчитан на сжатие с потерями и позволяет получить небольшие файлы с 24-битовой глубиной цвета. Можно задавать уровень сжатия (т.е. потери данных), но даже при задании максимального качества JPEG теряет некоторые детали и поэтому реально пригоден только для просмотра изображений в онлайновом режиме. Число доступных уровней сжатия зависит от используемой программы редактирования изображений.

Формат файла	Размер изображения	Число цветов
BMP - RGB	1 МБ	16.7 млн
BMP - RLE	83 КБ	256
GIF	31 КБ	256
JPEG - мин. сжатие	185 КБ	16.7 млн
JPEG - мин. прогрессивное сжатие	150 КБ	16.7 млн
JPEG - макс. сжатие	20 КБ	16.7 млн
JPEG - макс. прогрессивное сжатие	16 КБ	16.7 млн
PCX	189 КБ	16.7 млн
TIFF	1 МБ	16.7 млн
TIFF - сжатие LZW	83 КБ	16.7 млн

Если не нужно сохранять цветовую информацию оригинального документа, то изображения для последующего оптического распознавания символов (Optical Character Recognition - OCR) лучше сканировать в шкале серого (greyscale). При этом используется только треть пространства RGB-сканирования. Альтернативой служит режим штрихового (line-art) сканирования (черно-белый режим), но при этом теряются детали, что снижает точность последующего оптического распознавания символов.

В таблице приведены относительные размеры файлов, которые можно получить в различных форматах при сохранении "естественного" изображения 1 МБ, а также поддерживаемые глубины цветов.

TWAIN-драйвер

Как ни странно, но TWAIN не акроним (хотя иногда его шутливо расшифровывают как "технология без важного названия" - technology without an important name) , а очень важный стандарт для ввода изображений, разработанный компаниями Hewlett-Packard, Kodak, Aldus, Logitech и Caere. Стандарт определяет, каким образом устройства ввода изображений, например сканеры, цифровые камеры и др., должны передавать данные в программные приложения. TWAIN позволяет приложениям работать с устройствами ввода изображений, ничего не зная о самом устройстве. Если устройство и приложение удовлетворяют стандарту TWAIN, они должны работать совместно независимо от того, как получено изображение.

К РС можно одновременно подключить несколько устройств ввода данных, удовлетворяющих стандарту TWAIN. Каждое из этих устройств будет иметь свой модуль TWAIN. Следовательно, приложения в стандарте TWAIN должны предоставлять пользователю возможность выбора TWAIN-устройства на время сессии. На практике для этого применяется опция Asquire (Выбор) в меню File приложения, например редактора PhotoShop. Пользователю выдается стимул выбрать подходящий TWAIN-источник, который запустит соответствующий драйвер устройства без выхода из основного приложения. После сканирования драйвер автоматически закрывается, оставляя сканированное изображение открытым в основном приложении. Здесь не нужно выходить, запускать или сохранять большие и, возможно, бесполезные файлы.

Все чаще производители предлагают сканеры с двумя TWAIN-драйверами. Первый драйвер предназначен для неопытного пользователя и осуществляет сканирование буквально одним щелчком на кнопке. После щелчка на кнопке Preview на экране в отдельной панели появляется небольшое изображение для предварительного просмотра. Здесь можно скорректировать сканируемую область и определить разрешающую способность и глубину пикселов. После получения хороших предварительных результатов щелчком на кнопке Scan инициирует действительное сканирование.

Для более опытных пользователей где-то в первом драйвере должна находиться кнопка расширенных опций Advanced Scanning Options. При щелчке на ней открывается второй драйвер, который предоставляет больше возможностей управления сканированием, например яркостью, контрастом, цветом и гамма-коррекцией. Это позволяет определить конкретные диапазоны значений оттенков либо в целом, либо для каждого первичного цвета по очереди.

Калибровка цвета

При работе с настольным сканером сканированное изображение может выглядеть по-разному на экране и на бумаге после печати и оба результата несколько отличаются от оригинала. Решение этой проблемы обеспечивает система калибровки (или согласования) цвета. Такая система в действительности нужна только для сканирования высококачественных изображений (пленок, профессиональных фотографий и др.), которые должны удовлетворять жестким стандартам качества. Сложности цвета и восприятия цвета людьми делает калибровку трудоемким занятием, но все же имеется несколько различных решений проблемы калибровки.

Наиболее полное решение предоставляет система управления цветом (Colour Management System - CMS) компании Kodak, которая использует свои определения цвета совместно с профилями для каждого имеющегося в РС сканера, монитора и принтера для преобразования и стандартизации цветов. Элементы системы Kodak встроены в графический редактор Adobe PhotoShop и другие программы. Сейчас CMS приобретает широкую популярность среди компьютерных графиков и других пользователей, которым требуются строго согласованные цвета.

Производители сканеров и программные компании разработали другие системы. Такие фирменные системы тоже можно применять при условии, что они содержат профили для всех тех устройств, которые применяются для сканирования, просмотра, редактирования и вывода окончательного изображения.

Еще один вариант называется коррекцией по выходу (output-based correction). В этом способе производится сканирование и вывод стандартного калибровочного изображения, а затем вносятся коррекции в цветовые профили для стандартизации цветов. Этот простой способ не подходит для пользователей, которым захочется постоянно рекалибровать свои системы для получения оптимальных результатов. Однако для обычного цветного сканирования коррекции по выходу вполне достаточно.

Оптическое распознавание символов

Когда страница текста сканируется в РС, она сохраняется как электронный файл, состоящий из крошечных точек, или пикселов; она воспринимается компьютером не как текст, а как "картина текста". Текстовые процессоры не могут редактировать растровые изображения. Чтобы превратить группы пикселов в редактируемые слова, изображение необходимо "пропустить" через сложный процесс, который называется оптическим распознаванием символов (Optical Character Recognition - OCR).

Исследования по OCR начались в конце 50-х годов прошлого века и с тех пор технология непрерывно развилась и совершенствовалась. В конце 70-х годов возможности программ OCR были довольно ограничены - они могли работать только с конкретными гарнитурами и размерами шрифтов. Сейчас программы OCR намного "интеллектуальнее" и могут распознавать практически все гарнитуры шрифтов, а также сильно искаженные изображения документов.

Один из первых методов OCR назывался соответствием матриц, или шаблонов (pattern matching). Значительная часть текста представлена гарнитурами шрифтов Times, Courier или Helvetica с размерами от 10 до 14 пунктов (1 пункт = 1/72 дюйма). В программе OCR, в которой применялся метод соответствия матриц, хранились матрицы точечных изображений символов всех гарнитур и размеров. Сравнивая матрицы из хранимой базы данных с матрицами сканированных букв, программа пытается распознать буквы. Такая программа могла работать только с моноширинными шрифтами, символы которых проще идентифицировать. Программа не могла работать со сложными многошрифтовыми документами и ограничена только хранимыми гарнитурами и размерами.

Следующим этапом в развитии OCR стало выделение признаков (feature extraction), т.е. попытка распознать символы, идентифицируя их универсальные признаки, с тем, чтобы сделать OCR независимым от гарнитуры. Если все символы можно было бы идентифицировать с помощью правил, определяющих петель и прямых контуров, то отдельные буквы можно идентифицировать независимо от гарнитуры. Например, буква 'a' состоит из окружности, прямой с правой стороны и дуги над серединой. Дуга над серединой не является обязательной. Таким образом, если сканированная буква имеет такие "признаки", то программа OCR может правильно идентифицировать ее как букву 'a'.

Конечно, выделение признаков было шагом вперед по сравнению с соответствием матриц, но на результаты плохо влияла некачественная печать. Дополнительные пометки на странице или пятна на бумаге сильно влияли на точность распознавания. Устранение влияния таких помех стало целым направлением исследований, чтобы определить, какие "кусочки" печати не являются фрагментами отдельных букв. После идентификации помех надежные фрагменты символов можно объединить в наиболее вероятные фигуры (формы) букв.

Ни одна программа OCR не обеспечивает 100%-ую точность распознавания сканированных букв. Некоторые программы OCR используют соответствие матриц и/или выделение признаков для распознавания максимального числа символов и дополняют эти методы применением контроля правильности орфографии нераспознанных букв. Если, например, программа OCR не может распознать букву 'e' в слове 'th~ir', то контроль орфографии слова 'th~ir' может определить, что пропущена буква 'e'.

Новые технологии OCR намного сложнее первых методов. Вместо идентификации отдельных символов современные методы пытаются идентифицировать целые слова. Такая технология называется предиктивным оптическим распознаванием слов (Predictive Optical Word Recognition - POWR).

Привлекая более высокие уровни контекстного анализа, метод POWR может практически устранить проблемы, вызванные помехами. Он позволяет РС "просеять" тысячи или миллионы способов объединения точек слова в символы. Каждой возможной интерпретации присваивается вероятность и выбирается слово, для которого получена максимальная вероятность. Метод POWR использует сложные математические алгоритмы, позволяющие РС остановиться на наилучшей интерпретации без проверки каждой возможной версии в отдельности.

Когда отдельным словам присвоены вероятности, учитываются все виды контекстной информации. Технология использует методы нейронных сетей и предиктивного моделирования из искусственного интеллекта. Это позволяет методу POWR идентифицировать слова таким образом, который напоминает визуальное распознавание человека. На практике этот метод значительно повышает точность распознавания слов во всех типах документов. Анализируются все возможные интерпретации, объединяя все источники данных от пикселной информации низкого уровня до контекстных связок высокого уровня. После этого выбирается наиболее вероятная интерпретация.

Несмотря на то, что системы OCR известны уже много лет, важность и преимущества их можно оценить только сейчас. Аппаратные и программные средства первых систем были очень дорогими, точность их была невысока, а пользоваться ими было довольно трудно. Многие приверженцы этой технологии вскоре разочаровались в ней. Однако за последние несколько лет положение с OCR значительно изменилось. Современные программы OCR очень точные, простые и удобные в работе, а также адаптированы к разнообразной рабочей обстановке.

Если нет специального требования сохранять цветовую информацию оригинального документа, лучше всего сканировать документы для OCR в шкале серого (greyscale). При этом объем сканированного документа уменьшается в три раза по сравнению с цветным сканированием. Режим ввода штрихов (line-art) позволяет получить даже меньшие размеры файлов, но за счет потери детальности, что снижает точность последующего распознавания.

Фоторетуширование

Цветные изображения от сканеров часто оказываются только началом. Например, имея оцифрованную фотографию, можно сильно изменить ее внешний вид с помощью растрового редактора или пакета графического редактора.

В рекламной и издательской деятельности очень мало изображений используются "сырыми" - внешний вид фотомодели "очищается", глаза подчеркиваются и раскрашиваются, а волосы причесываются. Появилась даже тенденция получения привлекающих внимание изображений путем деформации и монтажа элементов фотографий.

В общем, фоторетушер пытается сделать одно из двух - изменить некоторые элементы рисунка естественным образом, который нельзя обнаружить (например, изменение цвета глаз кого-то), или получить что-то нереальное и невозможное увидеть. В любом случае, рука ретушера должна быть незаметной.

Обычно такая работа выполняется с использованием мощного графического редактора Adobe PhotoShop, но даже простейшие пакеты рисования допускают такие изменения. Но хотя многое можно реализовать с помощью дешевых пакетов (PaintShop Pro и PC Paintbrush), графические редакторы типа PhotoShop, Xres и Corel PhotoPaint позволяют проще реализовать сложные эффекты.

Меню энциклопедии