Распознавание

Распознавание текста после сканирования и успешность этого процесса находится в прямой зависимости от двух факторов: грамотности использования характеристик сканера и качества используемой программы для распознавания текста. При автоматической настройке сканера, практикуемой сегодня пользователями чаще всего, тем более важны становятся последующие действия, связанные с обработкой текста. Если мы хотим получить в результате сканирования не просто картинку, изображение, а цифровой текст, с которым можно работать, редактировать, размещать в сети, нам понадобится соответствующий софт. Кроме того, распознанный текст в любом из распространенных форматов занимает гораздо меньше места на диске, чем качественное изображение — то есть «фотография» этого текста.

Современные программы распознавания текста (OCR) умеют понимать самые сложные текстовые элементы — таблицы, надстрочные элементы, тексты, набранные на нескольких языках. Самая популярная русскоязычная OCR сегодня — ABBYY FineReader, которая распространяется на коммерческой основе. Ее конкурент, не обладающий столь же широким функционалом, однако более чем достаточный для работы с текстом, — бесплатная программа CuneiForm. Однако в любом случае процесс распознавания текста после сканирования требует участия человека.

Программы практически безупречно распознают текст, четко отпечатанный на хорошей бумаге, однако любые отклонения от стандарта могут вызвать у логичной и последовательной программы сбои и недоумения: формулы, шрифтовые выделения, изменения размера букв, ударения и подчеркивания, шероховатости бумаги превращаются в самые невероятные сочетания букв в распознаваемом тексте. Для адекватного распознавания текста после сканирования необходим человеческий интеллект.

Пока интеллект искусственный остается научной фантастикой, путь и кажущейся совсем близкой к реализации: идеальный компьютерный перевод, точное распознавание речи пока невозможны. Программы распознавания текста и речи постепенно совершенствуются, но сегодня только участие человека в процессе обеспечивает вменяемый конечный результат. Тщательная сверка оригинала и распознанного текста предполагается самим программами: во всех OCR есть возможность параллельного расположения «текста-картинки» и распознанного варианта для коррекции.

Сканирование книг, документов, изображений