Abbyy finereader как работать с программой. FineReader сканирование

Определение структуры документа

ABBYY FineReader представляет революционно новый подход к распознаванию документов. Теперь документ анализируется и обрабатывается целиком, а не постранично, что позволяет FineReader понять такие элементы его внутренней структуры, как верхние и нижние колонтитулы, сноски, подписи к картинкам и диаграммам, стили, шрифты и т.д. Элементы исходного документа восстанавливаются в результирующем документе. Например, при сохранении в Word верхние и нижние колонтитулы, сноски воспроизводятся как соответствующие объекты в Word.

Отличное качество распознавания и точное сохранение оформления

Система оптического распознавания ABBYY FineReader точно распознает и максимально полно сохраняет исходное оформление любого документа (в том числе с текстом на фоне картинок, с цветным текстом на цветном фоне, с обтеканием картинок текстом и т.д.)

Распознавание многоязычных документов

ABBYY FineReader распознаёт документы на 188 языках, включая русский, английский, немецкий, французский, испанский, итальянский, шведский, финский, болгарский, венгерский, словацкий, чешский, башкирский, белорусский, казахский, китайский, украинский и др. Текст документа может быть составлен на двух и более языках. Пользователь может указать свой язык распознавания для каждого блока типа или для каждой ячейки таблицы.

Интеллектуальное распознавание PDF-документов

Как известно, некоторые PDF-файлы содержат так называемый текстовый слой, причём его содержимое может не полностью соответствовать видимому на экране документу. FineReader предварительно анализирует содержимое файла и для каждого текстового блока принимает решение: распознать его или извлечь соответствующий текст из текстового слоя. Таким образом удаётся увеличить качество распознавания и сократить время обработки.

Распознавание цифровых фотографий документов

Теперь для распознавания необязательно оснащать компьютер сканером. ABBYY FineReader позволяет распознавать фотографии документов, сделанные цифровой камерой (рекомендуется использовать цифровой фотоаппарат с разрешением матрицы 4 Мпикс и выше).

Существует множество случаев, когда для получения изображения удобнее использовать фотоаппарат, нежели сканер. Например, во время деловой встречи вне офиса, при распознавании вывесок или объявлений, в библиотеке, особенно при работе с толстыми или старинными книгами. Не говоря уже о том, что цифровой фотоаппарат работает в несколько раз быстрее любого сканера.

Распознавание гиперссылок

Такие документы могут быть сохранены в форматах Microsoft Word, PDF и HTML. Кроме того, в распознанный текст можно добавлять собственные гиперссылки.

При распознавании PDF-файлов, помимо внешних ссылок, восстанавливаются и внутренние (на другие страницы того же документа).

Распознавание скриншотов

В комплект поставки системы включен ABBYY Screenshot Reader. Это простое и удобное приложение предназначено для распознавания текста с любой области экрана. ABBYY Screenshot Reader переводит в редактируемый формат такие тексты, которые нельзя скопировать обычным способом - системные сообщения, надписи во Flash-роликах и т.д. Как распознанный текст, так и снимок экрана могут быть сохранены в виде файла или переданы в буфер обмена.

Распознавание штрих-кодов

ABBYY FineReader поддерживает распознавание штрих-кодов, в том числе двухмерных типа PDF-417.

    Для того чтобы воспользоватся программой ABBYY FineReader которая предназначена для распознавания текста с нередактируемых и графических форматов. необходимо для начала скачать ее и установить на компьютер, а после посмотреть ролик представленный ниже здесь все подробно рассказано о данной программе.

    Данная программа, предназначена для сканирования текста и произведения, его распознавания.

    Использована она конечно же может быть, а для осуществления этого пользования, можно не выходя из самой програмке Finereader, в раках которой вы работаете, распознать текст файла и в дальнейшем трансформировать его из скано-копии документа, в классический формата, программы Word. Дальше она получится что будет в вашем пользовании.

    Finereader - это программа для сканирования и распознавания текста с экспортом информации в популярные офисные пакеты. Принцип работы с ним в двух словах можно описать так: берем бумажный лист с напечатанным текстом, сканируем его сканером, получаем некий графический файл растрового формата. Потом не выходя из программы Finereader распознаем текст файла и следующим шагом делаем из скано-копии документ формата Word. Перед этим распознанный текст можно просмотреть и отредактировать. Полученный word-овский документ можно уже дальше дополнять и редактировать.

    Программа Abbyyfinereader бесспорно является лидером среди подобных программ.

    Она обладает очень широкими возможностями по распознаванию текста с нередактируемых и графических форматов.

    Программа сможет распознать текст с таких основных форматов как (нередактируемых pdf,цифровые форматы файлов jpeg, jpg, Djvu, gif, png и т.д.).

    Также программа ABBYY FineReader неплохо работает практически со всеми моделями сканеров.

    Основными функциями программы являются:

    Сканирование документов в форматы: Microsoft Word, Microsoft Excel, Pdf, сканирование и сохранение изображений, PDF или изображение в Microsoft Word, конвертировать фото в Microsoft Word.

    Рабочая область программы ABBYY Finereader:

    Для добавления новой задачи, необходимо нажать на кнопку **новое задание **, которая находится в левой верхней части, рабочей области программы.

    Откроется окно новое задание

    В открывшемся окне необходимо выбрать ту задачу которую нужно выполнить.

    Допустим у нас есть фотография документа который мы хотим конвертирывать в формат документа Microsoft Word. Для этого в окне новое задание находим активную надпись Конвертировать фото в Microsoft Word и нажимаем на эту надпись. Откроется окно проводника программы с предворительным просмотром :

    В открывшемся окне выбираем фото текстового файла которое необходимо распознать и конвертировать в нужный вам формат.

    Откроется окно со шкалой процесса распознования :

    После того как программа обработает фото и попытается распознать текст.

    Вы увидите следующее :

    Здесь вы сможете выбрать область вашего фото для распознования текста.

    После выбора области нажмите кнопку распознать которая находится в верхнем меню программы. Программа приступит к конвертации выбранного фото в текст. После обработки изображения нажмите на стрелку рядом скнопкой сохранить и выберите нужный формат для создания текстового документа:

    Мощная и функциональная программа ABBYY FineReader , предназначена для качественного сканирования и точного распознавания (это зависит от разрешения, выставленного при сканировании) различных бумажных носителей информации с печатным текстом (книг, журналов, газет и т.п.), а также изображений цифрового формата.

    Программа поддерживает различные языки распознавания, умеет сохранять в: Microsoft Word, PDF, форматы изображений и другие форматы. Так как программа имеет интуитивно-понятный интерфейс, работать с ней удобно.

    Итак, первым делом нужно сначала выставить настройки и отсканировать документ, получим изображение, текст которого следует программе распознать . После распознавания можно подкорректировать текст (если есть какие-либо неточности) и сохранить его в желаемый формат.

Итак, на компьютере у нас установлен FineReader. Включаем сканер и оцифровываем какой-нибудь многостраничный документ. Назовем его, условно, "Договор".

Укладываем на стекло сканера первую страницу документа, закрываем крышку. Запускаем программу FineReader. Кликаем кнопку "Сканировать", или клавишами давим сочетание "Ctrl+K". Открывается окно "Сканирование ABBYY FineReader". При оцифровке обычной текстовой страницы набраной шрифтом в 11-12 пунктов оставляем настройки в окне по умолчанию и нажимаем кнопку "Просмотр".

Сканер работает и через несколько секунд видим нашу страницу в окошке просмотра. Здесь мы можем изменить размер скана, если надо. И потом нажимаем кнопку "Сканировать".

FineReader начинает процесс распознавания текста и в течение минуты изображение страницы открывается в окне программы. Правая часть окна делится теперь на три раздела. В левом разделе "Изображение" мы можем редактировать изображение. Подробнее о редактировании изображения можно почитать в уроке: Сканирование книги . В правом разделе "Текст" можно сразу вносить изменения в текст - редактировать содержание страницы еще до его сохранения. Это очень удобно, когда нужно, например, быстро изменить в документе даты, реквизиты, фамилии.

В левой части окна "Страницы" появляется пиктограмма распознанной страницы:

Если редактировать ничего не надо, заменяем первую страницу на стекле сканера второй страницей и повторяем технологию. Один раз настроив размеры скана в окне "Сканирование ABBYY FineReader" в режиме "Просмотр" для первой страницы, теперь сразу кликаем кнопку "Сканировать". Установленные для первой страницы настройки сохраняются, и последующие страницы сканируем без предварительного просмотра. Так сканируем все страницы нашего документа.

Закончили, и теперь, поочередно кликая по пиктограммам открываем страницы, проверяя правильную их последовательность.

После этого, в левой части окна "Страницы" выделяем все пиктограммы кнопкой: "Правка – Выделить все" или клавиатурным сочетанием: "Ctrl+A". Затем, в выпадающем списке рядом с кнопкой "Сохранить" выбираем команду: "Сохранить как документ PDF":


Хлопаем теперь по самой кнопке и сохраняем документ с именем "Договор.pdf" в папку «Договор»:


В итоге получаем многостраничный текстовый документ pdf-формата - электронную версию нашего документа с условным названием "Договор".

Так, FineReader’ом оцифровываем текстовые документы.

Изменив режим сканирования на "цветной" в окне "Сканирование ABBYY FineReader" также легко оцифруем цветные картинки и фотографии.

А, задав в контекстном меню, например, команду: "Сохранить как документ Microsoft Word 2007" преобразуем наш проект в единый многостраничный редактируемый вордовский документ.

Вобщем, программа легко усвояемая, интуитивно понятная и везде всплывающие подсказки.

В этот раз расскажу как превращать бумажные документы в электронный вид формата PDF, а также, как бумажный документ перекинуть в компьютер с целью изменить текст. Итак начнем.
У меня на руках бумажный документ.

СКАНИРОВАНИЕ в PDF

Задача: перекинуть в компьютер (перевести в электронный вид) этот документ. Притом нужно сделать именно в таком виде чтобы нельзя было его в будущем изменить (грубо говоря надо сделать фото документа). Потом этот электронный документ нужно переслать по почте на электронный адрес. Притом клиент просит именно в формате pdf.

По этапам:
1) пропускаю документ через сканер
2) сохраняю полученный отпечаток в формате pdf на свой компьютер
3) пересылаю полученный файл по почте
В своей работе я использую для решения такой задачи 2 программы:
Foxit Phantom или ABBYY FineReader. Для понятности прикладываю скриншоты:
В Foxit Phantom при включенном сканере необходимо в главном меню выбрать ФАЙЛ-СОЗДАТЬ PDF-СО СКАНЕРА…
Произойдет сканирование и появится предложение сохранить файл. Выбираем место, пишем название файла и сохраняем.

В ABBYY FineReader в панели инструментов есть огромные кнопки. Одна из них называется СКАНИРОВАТЬ в PDF. Её и используем.

Если же надо отсканировать многостраничный документ то, по этапам:
1) Нажимаем кнопку под номером 1 СКАНИРОВАНИЕ

Получаем отсканированный документ

Также сканируем ещё одну страницу (нажимаем ещё раз кнопку под номером 1 СКАНИРОВАНИЕ).
2) Сохраняем в PDF



В итоге получаем готовый многостраничный документ в виде файла в формате PDF.

Теперь данный файл можно отправлять по электронной почте.

РАСПОЗНАВАНИЕ ТЕКСТА

Задача: перевести бумажный документ в электронный вид (в компьютер)

По этапам:
1) Сканирование (кнопка 1 СКАНИРОВАНИЕ)

2) Распознавание (кнопка 2 РАСПОЗНАТЬ ВСЕ)

Распознавание нужно понимать как процесс перевода фотографии (картинки) в текст (буквы, цифры, знаки). Если Вы сфотографировали текстовую страницу, то после распознавания 99% текста с бумаги превратиться в текст электронный. Электронный текст уже можно на компьютере менять (редактировать) так, как Вам захочется.

3) Сохранение в текстовый редактор (кнопка 4 Сохранить)
Советую выбирать ПЕРЕДАТЬ ВСЕ СТРАНИЦЫ В-MICROSOFT WORD

Получаем

Хотелось бы указать на важные моменты при процедуре РАСПОЗНАВАНИЯ. Есть нюансы при работе.
Сразу после распознавания советую поглядеть на результат. Особенно на блоки, которые создает программа FineReader.

Это области выделенные в прямоугольные рамки. Рамки эти разного цвета. Если красного цвета-то этот блок распознался как КАРТИНКА. Если черного цвета - то ТЕКСТ. Блоки бывают разного типа. Тип блока можно узнать щелкнув на блоке ПРАВОЙ клавишей мыши и выбрав ИЗМЕНИТЬ ТИП БЛОКА.

Маленькая хитрость: можно выделить произвольную область и пометить любым типом блок. Например выделим ту часть текста, которая плохо распознается, при помощи левой клавиши мыши (нажимает, удерживаем и тянем, рамка меняет размер).

В итоге документ в Word-е будет иметь блок текста и блок картинка. Блок картинка будет иметь абсолютно неизменный вид. Данный способ я использую при сохранении печатей, нестандартных шрифтов, картинок, фотографий.

ЗЫ: Знания и умения работать с PDF, сканировать и распознавать документы очень часто выручают в офисной работе. Знание - экономит Ваше время!

Один из популярнейших функционалов по работе со сканированием и обработкой файлов различного типа - Файн Ридер. Функционал программного продукта был разработан российской компанией ABBYY, он позволяет не только распознавать, но и обрабатывать документы (переводить, менять форматы и другое). Многие пользователи могут только установить, а как пользоваться ABBYY FineReader, сразу разобраться не могут. На многие вопросы вы сможете найти ответы в этой статье.

Программа позволяет сканировать и распознавать текст — и не только

Чтобы подробно разобраться, что это за программа ABBYY FineReader 12, необходимо подробно рассмотреть все её возможности. Первой и самой простой функцией является сканирование документа. Существует два варианта сканирования: с распознаванием и без него. В случае обычного сканирования печатного листа вы получите изображение, которое сканировали в указанной папке на вашем компьютерном устройстве.

ВНИМАНИЕ. Лист нужно класть на сканирующую часть принтера ровно, по указанным на принтере контурам. Не допускайте заламывания исходника, это может привести к плохому качеству итогового скана.

Вы должны самостоятельно решить, для чего нужен FineReader именно вам, так как утилита имеет значительный функционал, например, вы можете самостоятельно выбрать в каком цвете хотите получить изображение, есть возможность перевести все фото в чёрно-белый . В чёрно-белом цвете распознавание происходит быстрее, качество обработки возрастает.

Если же вас интересует функция распознавания текста ABBYY FineReader, перед сканированием вам нужно нажать специальную кнопку. В этом случае есть несколько вариантов получения информации. Стандартно на ваш экран выведется распознанный кусок листа, который вы сможете скопировать или отредактировать вручную.

Если вы выберите другие функции, то сможете сразу получить файл Word-документом или Excel-таблицей . Выбирать функции очень просто, меню интуитивно понятно, легко настраивается благодаря тому, что все нужные вам кнопки перед глазами.

ВАЖНО. Перед тем как распознать текст ABBYY FineReader, вам необходимо точно подобрать язык обработки. Несмотря на то, что утилита работает полностью автоматически, бывает, что низкое качество исходника не позволяет понять, что за язык был в исходнике. Это сильно снижает качество итоговых результатов работы приложения.

Несколько режимов работы

Чтобы полностью разобраться, как пользоваться ABBYY FineReader 12, необходимо попробовать два режима работы «Тщательный» и «Быстрое распознавание». Второй режим подходит для высококачественных изображений , а первый - для низкокачественных файлов. Режим «Тщательный» в 3–5 раз дольше обрабатывает файлы.

На иллюстрации показан результат работы программы — распознавание текста с изображения

Какие ещё есть функции?

Распознавание текста в программе ABBYY FineReader не единственная полезная функция. Для большего удобства пользователей имеется