OCR - це

 Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на веб-сторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад, форматування або перетворення в мовлення. Оптичне розпізнавання тексту є досліджуваною проблемою в галузях розпізнавання образів, штучного інтелекту і комп'ютерного зору.

Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; у ранніх версіях, для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. Зараз найпоширеніші так звані «інтелектуальні» системи, що розпізнають більшість шрифтів із високим ступенем точності. Деякі системи оптичного розпізнавання тексту здатні відновлювати вихідне форматування тексту, в
ключаючи зображення, колонки й інші нетекстові компоненти.

Етапи розпізнавання тексту:



Що вміють сучасні програми з OCR?



Методи розпізнавання тексту:




Яка користь ?

Наприклад:

Раніше на оформлення страховки потрібно 15-20 хвилин. За допомогою нашого OCR-софта все вирішується за 5 хвилин і 3 прості кроки:

Співробітник фотографує документ

Поля електронної заяви заповнюються автоматично

Швидко перевіряє текст на наявність помилок.

Джерела :

Коментарі

Популярні публікації