Главная / Каталог

Устройство персонального компьютера

Файл, создаваемый сканером в памяти машины, называется битовой картой. Существуют два формата представления графической информации в файлах компьютера: растровый формат и векторный.

В растровом формате графическое изображение запоминается в файле в виде мозаичного набора множества точек (нулей и единиц), соответствующих пикселям отображения этого изображения на экране дисплея. Редактировать этот файл средствами стандартных текстовых и графических процессоров не представляется возможным, ибо эти процессоры не работают с мозаичным представлением информации. В текстовом формате информация идентифицируется характеристиками шрифтов, кодами символов, абзацев и т.п. Стандартные текстовые процессоры предназначены для работы именно с таким представлением информации.

Следует также иметь в виду, что битовая карта требует большого объема памяти для своего хранения. Так, битовая карта с 1 листа документа формата А4 (204х297 мм) с разрешением 10 точек/мм и без передачи полутонов (штриховое изображение) занимает около 1 Мбайта памяти, она же при воспроизведении 16 оттенков серого - 4 Мбайта, при воспроизведении цветного качественного изображения (стандарт Kigh Color - 65536 цветов) - 16 Мбайт. Иными словами, при использовании стандарта True Color и разрешающей способности 50 точек/мм для хранения даже одной битовой карты может не хватить емкости НЖМД. Сокращение объема памяти, необходимой для хранения битовых карт, осуществляется различными способами сжатия информации, например TIFF (Tag Image File Format), CT1FF (Compressed TIFF), JPEG, PCX, GIF (Graphics Interchange Format - формат графического обмена) и др. (файлы с битовыми картами имеют соответствующие указанным аббревиатурам расширения).

Наиболее предпочтительным является использование сканера совместно с программами систем распознавания образов, например типа OCR (Optical Character Recognition). Система OCR распознает считанные сканером с документа битовые (мозаичные) контуры символов (букв и цифр) и кодирует их ASCII-кодами, переводя в удобный для текстовых редакторов векторный формат.

Некоторые системы OCR предварительно нужно обучить распознаванию - ввести в память сканера шаблоны и прототипы распознаваемых символов и соответствующие им коды. Сложности возникают при распознавании букв, совпадающих по начертанию в разных алфавитах (например, в латинском (английском) и в русском - кириллица), и разных гарнитур (способов начертания) шрифтов. Но большинство систем не требуют обучения: в их памяти уже заранее помещены распознаваемые символы. Так, одна из лучших OCR - программный пакет TIGER 2.0 содержит прототипы 30 различных гарнитур, а для распознавания английских и русских букв использует встроенные электронные словари.

В последние годы появились интеллектуальные программы распознавания образов типа Omnifont, которые опознают символы не по точкам, а по характерной для каждого из них индивидуальной топологии. При наличии системы распознавания образов текст записывается в память ПК уже не в виде битовой карты, а в виде кодов, и его можно редактировать обычными текстовыми редакторами.

Сканер подключается к параллельному порту ПК. Для работы со сканером ПК должен иметь специальный драйвер, желательно драйвер, соответствующий стандарту TWAIN. В последнем случае возможна работа с большим числом TWAIN-совместимых сканеров и обработка файлов поддерживающими стандарт TWAIN программами, например распространенными графическими редакторами Corel Draw, Max Mate, Picture Publisher, Adobe PhotoShop, Photo Finish. Распознавание текста FineReader. Большинство драйверов ориентированы на работу с локальным компьютерным интерфейсом SCSI.

EMBED Word.Picture.8