Заказать курсовые, контрольные, рефераты...
Образовательные работы на заказ. Недорого!

Программное обеспечение распознавания информации

РефератПомощь в написанииУзнать стоимостьмоей работы

Настроить горячие клавиши — можно как заменить предустановленные сочетания, так и добавить свои горячие клавиши для выполнения команд программы. Распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок; Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character… Читать ещё >

Программное обеспечение распознавания информации (реферат, курсовая, диплом, контрольная)

Для максимально эффективного использования устройства необходима программа распознавания текста С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Но работать с текстом невозможно по определённым причинам:

  • — страница с текстом представляет собой графический файл — обычную картинку;
  • — текст нельзя редактировать и форматировать;
  • — необходимо преобразовать элементы графического изображения в последовательности текстовых символов.

Основным методом перевода бумажных документов в электронную форму является сканирование:

  • — в результате сканирования получается графическое изображение, состоящее из точек;
  • — количество точек определяется размером изображения и разрешением сканера.

Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition — OCR).

Наиболее распространенные системы оптического распознавания символов:

1) ABBYY FineReader.

FineReader — омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати.

OCR-технологии от компании ABBYY также поддерживают зональное распознавание (распознавание на уровне полей), необходимое во многих ключевых бизнес-процессах, таких как классификация по ключевым словам, индексирование по ключевым словам и ввод данных с форм. L, PDF/A, searchable PDF, CSV и текстовые (plain text) файлы.

Интерфейс.

Пользователь может настроить рабочее пространство по своему усмотрению:

  • — Изменить расположение и размер окон
  • — Настроить панель быстрого доступа, предназначенную для доступа к наиболее часто используемым командам
  • — Настроить горячие клавиши — можно как заменить предустановленные сочетания, так и добавить свои горячие клавиши для выполнения команд программы
  • — Выбрать нужный язык интерфейса и др.

Содержание раздела:

Главное окно программы Панели инструментов Как настроить рабочее пространство программы ABBYY FineReader.

Диалог Опции Возможности:

  • — позволяет извлекать текстовые данные из цифровых изображений;
  • — полученное в результате распознавания может быть сохранено в различных форматах.

Дополнительные возможности:

  • -Использование шаблонов;
  • -Распознавание с обучением;
  • -Создание новых языков и группы языков;
  • -Коллективная работа в сети.
  • 2) CuneiForm

оптический символ текст интерфейс.

CuneiForm — это программа для оптического распознавания текста документов в редактируемый вид. Результаты работы программы можно редактировать в офисных программах и текстовых редакторах и сохранять в популярных форматах, проводить по ним полнотекстовый поиск.

CuneiForm является предшественницей систем промышленного распознавания и понимания документов. Многие технологические ноу-хау, результаты научных исследований, положенные в основу CuneiForm, успешно применяются и совершенствуются по сей день в коммерческих продуктах Cognitive Technologies.

Возможности:

  • — при распознавании с помощью CuneiForm сохраняется структура документа и его форматирование;
  • — программа распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки;
  • — распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок;
  • — алгоритмы оптического распознавания (OCR, Optical Character Recognition), встроенные в программу позволяют распознавать текст с матричного принтера, плохих ксерокопий и факсов;
  • — распознавание документов более чем на 20 языках: на русском, английском, немецком, французском, испанском, итальянском, шведском, украинском и других;
  • — для повышения качества распознавания в программе используется словарная проверка. При этом стандартный словарь можно расширить за счет импорта новых слов из текстовых файлов.

Достоинства CuneiForm:

  • — практически единственная бесплатная OCR-программа профессионального уровня.
  • — большое количество языков распознавания.
  • — простой и понятный интерфейс.
  • — кроссплатформенность.
  • — на русском языке.

Эксперты о CuneiForm и FineReader.

CHIP Special 2/2002 «Наиболее сильным соперником FineReader является программа CuneiForm, которая долгие годы успешно с ним конкурировала. Следует отметить, что CuneiForm первой получила признание на Западе, будучи встроена в популярный CorelDraw, а также установлена во многих госструктурах США, например, в аппарате президента, ФБР, ЦРУ, Министерстве обороны и т. д.

Но постепенно, начиная с четвертой версии, лидерство FineReader становилось все более очевидным…".

Показать весь текст
Заполнить форму текущей работой