OCR的識(shí)別率不高
問(wèn):我使用掃描儀的OCR功能實(shí)現(xiàn)一些印刷文字資料的識(shí)別,但識(shí)別率一直不太理想,請(qǐng)問(wèn)應(yīng)該如何做才能提高OCR的識(shí)別率?
答:OCR是一種印刷文字識(shí)別軟件,它只能識(shí)別印刷體的原稿。影響OCR識(shí)別率的因素很多,最主要是掃描后圖像質(zhì)量的好壞,如果出現(xiàn)黑邊框、混雜有圖形表格、文字歪斜等都會(huì)使OCR識(shí)別錯(cuò)誤率大增,甚至無(wú)法進(jìn)行。一般OCR要求識(shí)別的文稿以黑白模式(Line/art)、300dpi或更高的分辨率掃描。如果掃描時(shí)使用的分辨率太低,也會(huì)造成文字識(shí)別率下降。
要提高OCR的文字識(shí)別率可通過(guò)以下方法改善:
? 盡量使用質(zhì)量較好的原稿,對(duì)掃描后的原稿進(jìn)行潤(rùn)色,使之盡量清晰、干凈、端正。
? 在進(jìn)行識(shí)別之前,先使用自動(dòng)傾斜校正和自動(dòng)版面分析命令處理原稿。
? 如果自動(dòng)版面分析的結(jié)果不理想,可以手工調(diào)節(jié)文本框到合適的大小。
? 如果原稿字跡較淡,可以調(diào)節(jié)掃描儀的“臨界值”選項(xiàng),使掃描的字跡加深以便識(shí)別。
![]() | ![]() .. 定價(jià):¥45 優(yōu)惠價(jià):¥42 更多書籍 |
![]() | ![]() .. 定價(jià):¥225 優(yōu)惠價(jià):¥213 更多書籍 |