Как работи OCR? Обяснено по прост и разбираем начин
Свързани Видеоклипове: (Може 2024).
В тази статия обясняваме как работи OCR. OCR означава „Оптично разпознаване на символи“ и просто се нарича на немски език за разпознаване на текст. Това означава, че компютърът може да разпознае текст на сканирано изображение с помощта на OCR и след това да го преобразува в обикновен текстов документ.
Ето как работи OCR
Представете си, че сте получили презентация на хартия от колега. Сега искате да редактирате тези на компютъра, защото не харесвате отделни пасажи. Затова го сканирайте и отидете на вашата OCR програма. Сега се случва следното:
- Софтуерът първо прави така наречения анализ на оформлението. За целта тя разглежда оформлението на страницата и отделя изображения от текст. Тя също така отбелязва позицията им на страницата. Тогава се броят броят на параграфите и се запаметяват отделни елементи като номера на страници.
- Сега идва трудната част. Софтуерът разглежда отделните текстови блокове и ги разгражда на изречения. След това изреченията се разделят на отделни думи, а думите - на букви.
- Софтуерът за OCR съдържа модели на букви и знаци. Програмата сега сравнява сканираните букви с тези модели. Ако те са 99% сходни, алгоритъмът решава, че вероятно трябва да е тази буква. Той е много прецизен, защото може да сравни много модели за кратко време. По този начин той успешно прави разлика между "8" и "B".
- Така буквите и знаците постепенно се разпознават. След това те се комбинират отново като думи и се поставят обратно на мястото им в изречението. Веднага след като софтуерът приключи, цялата работа се записва в нормален документ, който след това можете да редактирате. Готово!
Искате ли да тествате познанията си в софтуера? Участвайте в голямата ни софтуерна викторина!