Программное обеспечение распознавания информации
Настроить горячие клавиши — можно как заменить предустановленные сочетания, так и добавить свои горячие клавиши для выполнения команд программы. Распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок; Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character… Читать ещё >
Программное обеспечение распознавания информации (реферат, курсовая, диплом, контрольная)
Для максимально эффективного использования устройства необходима программа распознавания текста С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Но работать с текстом невозможно по определённым причинам:
- — страница с текстом представляет собой графический файл — обычную картинку;
- — текст нельзя редактировать и форматировать;
- — необходимо преобразовать элементы графического изображения в последовательности текстовых символов.
Основным методом перевода бумажных документов в электронную форму является сканирование:
- — в результате сканирования получается графическое изображение, состоящее из точек;
- — количество точек определяется размером изображения и разрешением сканера.
Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition — OCR).
Наиболее распространенные системы оптического распознавания символов:
1) ABBYY FineReader.
FineReader — омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати.
OCR-технологии от компании ABBYY также поддерживают зональное распознавание (распознавание на уровне полей), необходимое во многих ключевых бизнес-процессах, таких как классификация по ключевым словам, индексирование по ключевым словам и ввод данных с форм. L, PDF/A, searchable PDF, CSV и текстовые (plain text) файлы.
Интерфейс.
Пользователь может настроить рабочее пространство по своему усмотрению:
- — Изменить расположение и размер окон
- — Настроить панель быстрого доступа, предназначенную для доступа к наиболее часто используемым командам
- — Настроить горячие клавиши — можно как заменить предустановленные сочетания, так и добавить свои горячие клавиши для выполнения команд программы
- — Выбрать нужный язык интерфейса и др.
Содержание раздела:
Главное окно программы Панели инструментов Как настроить рабочее пространство программы ABBYY FineReader.
Диалог Опции Возможности:
- — позволяет извлекать текстовые данные из цифровых изображений;
- — полученное в результате распознавания может быть сохранено в различных форматах.
Дополнительные возможности:
- -Использование шаблонов;
- -Распознавание с обучением;
- -Создание новых языков и группы языков;
- -Коллективная работа в сети.
- 2) CuneiForm
оптический символ текст интерфейс.
CuneiForm — это программа для оптического распознавания текста документов в редактируемый вид. Результаты работы программы можно редактировать в офисных программах и текстовых редакторах и сохранять в популярных форматах, проводить по ним полнотекстовый поиск.
CuneiForm является предшественницей систем промышленного распознавания и понимания документов. Многие технологические ноу-хау, результаты научных исследований, положенные в основу CuneiForm, успешно применяются и совершенствуются по сей день в коммерческих продуктах Cognitive Technologies.
Возможности:
- — при распознавании с помощью CuneiForm сохраняется структура документа и его форматирование;
- — программа распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки;
- — распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок;
- — алгоритмы оптического распознавания (OCR, Optical Character Recognition), встроенные в программу позволяют распознавать текст с матричного принтера, плохих ксерокопий и факсов;
- — распознавание документов более чем на 20 языках: на русском, английском, немецком, французском, испанском, итальянском, шведском, украинском и других;
- — для повышения качества распознавания в программе используется словарная проверка. При этом стандартный словарь можно расширить за счет импорта новых слов из текстовых файлов.
Достоинства CuneiForm:
- — практически единственная бесплатная OCR-программа профессионального уровня.
- — большое количество языков распознавания.
- — простой и понятный интерфейс.
- — кроссплатформенность.
- — на русском языке.
Эксперты о CuneiForm и FineReader.
CHIP Special 2/2002 «Наиболее сильным соперником FineReader является программа CuneiForm, которая долгие годы успешно с ним конкурировала. Следует отметить, что CuneiForm первой получила признание на Западе, будучи встроена в популярный CorelDraw, а также установлена во многих госструктурах США, например, в аппарате президента, ФБР, ЦРУ, Министерстве обороны и т. д.
Но постепенно, начиная с четвертой версии, лидерство FineReader становилось все более очевидным…".