border=0

Технологія »OCR

Визначення OCR


Ми бачимо, що не тільки сканер може розпізнавати букви і тип.

Оптичне розпізнавання чи оптичне розпізнавання символів , перекладене на іспанську мову, є технологією, що має на меті емуляцію людського ока, ця технологія намагається змусити його розпізнати піксельні символи та тип шрифту (шрифту), який зроблено документ Мова йде про нормальний і поточний сканер і досить потужне програмне забезпечення. Коли ми посилаємося на потужне програмне забезпечення, ми маємо на увазі велику і достатню базу даних, щоб мати можливість розпізнавати різні букви і їх відповідні типи.


Крім програмного забезпечення, важливим є сканер. Дуже чутливий сканер краще читатиме пікселі документа, оскільки ця чутливість сприятиме зменшенню кількості помилок. Досить складно, що програмне забезпечення не помиляється. Будь-який документ поміщається в сканер і виходить у форматі Word або у форматі, який програма дозволяє вам вибирати. Після цього документ повинен бути виправлений. Після виправлення, ми можемо поставити його в PDF для спільного використання або в архіві.


Одним з великих можливостей, які надаються OCR, є сканування книг. Як, наприклад, колекція національної бібліотеки. Також знаменитий e.book, який можна прочитати скрізь в ipad і планшетах типу android і читачах електронних книг .


Приклад сканування книги.

Технологія OCR має обмеження. Він не працює для старих текстів або з якоїсь причини вони зазнали фізичного погіршення. Це погіршення є дуже нормальним, коли мова йде про історичні документи, які можуть мати до тисячі років. Документи цього типу, для яких роки зробили невдачу, цілком не розпізнаються для даної технології OCR. Ці типи документів зазвичай архівуються з високою роздільною здатністю сканування у фотографічному форматі, так що громадськість може захоплюватися всіма деталями документа без його погіршення.
Роздільна здатність у розпізнаванні повідомляє нам про те, як детально визначає сама система. Для чітких і визначених текстів нормально використовувати 300 dpi (точок на дюйм). Це налаштовано зі сканера. Один дюйм дорівнює 25,400 міліметрів , тому 300 пікселів для такої маленької області достатньо. У випадку газет або подібних. Там, де лист невеликий і папір завжди трохи побита, оптимальною роздільною здатністю буде 600 dpi. Якщо ми скануємо до цієї останньої резолюції, то краще мати хороший сканер, оскільки це коштує багато для спільного сканера, щоб завершити дію в цій резолюції.

Еволюція OCR проходить через вдосконалення цієї системи. Покращення, яке вже відбувається в проекті IMPACT. Цей проект має на меті обмін інформацією між кількома державними установами та окремими компаніями з метою розробки програмного забезпечення, що відповідає всім вимогам для масової оцифровки.

Автор: Francisco Cano | + QUOTE
Теми в розпізнаванні

Соціальні мережі