国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

初探利用Python進行圖文識別(OCR)

2020-02-16 01:22:22
字體:
來源:轉載
供稿:網友

話說什么是OCR?????

簡介

OCR技術是光學字符識別的縮寫(Optical Character Recognition),是通過掃描等光學輸入方式將各種票據(jù)、報刊、書籍、文稿及其它印刷品的文字轉化為圖像信息,再利用文字識別技術將圖像信息轉化為可以使用的計算機輸入技術。可應用于銀行票據(jù)、大量文字資料、檔案卷宗、文案的錄入和處理領域。適合于銀行、稅務等行業(yè)大量票據(jù)表格的自動掃描識別及長期存儲。相對一般文本,通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度4個方面作為OCR技術的評測依據(jù);而相對于表格及票據(jù),通常以識別率或整張通過率及識別速度為測定OCR技術的實用標準。

解析

采用OCR識別技術,可以將其應用于銀行票據(jù)光盤縮微系統(tǒng),可以自動提取票據(jù)要素,可減輕操作員的工作量,減少重復勞動,尤其是在與銀行事后且監(jiān)督系統(tǒng)相結合后,可以替代原先的操作人員完成事后監(jiān)督工作。由計算機自動識別票據(jù)上的日期、帳號、金額等要素,通過銀行事后監(jiān)督系統(tǒng)與業(yè)務系統(tǒng)中的數(shù)據(jù)進行比較,完成傳統(tǒng)的事后監(jiān)督操作;配有印章驗證系統(tǒng)后,自動將憑證圖像中的印章與系統(tǒng)中預留的印鑒進行比較,完成印章的真?zhèn)巫R別。

OCR識別技術不僅具有可以自動判斷、拆分、識別和還原各種通用型印刷體表格,在表格理解上做出了令人滿意的實用結果,能夠自動分析文稿的版面布局,自動分欄、并判斷出標題、橫欄、圖像、表格等相應屬性,并判定識別順序,能將識別結果還原成與掃描文稿的版面布局一致的新文本。表格自動錄入技術,可自動識別特定表格的印刷或打印漢字、字母、數(shù)字,可識別手寫體漢字、手寫體字母、數(shù)字及多種手寫符號,并按表格格式輸出。提高了表格錄入效率,可節(jié)省大量人力。同時支持將表格識別直接還原成PTF、PDF、HTML等格式文檔;并可以對圖像嵌入橫排文本和豎排文本、表格文本進行自動排版面分析。  利用目前的高新技術-OCR,直接從憑證影像中提取金額、帳號等重要數(shù)據(jù),代替人的手工錄入,與條碼識別/流水識別緊密結合,實現(xiàn)建立事后副本帳、完成事后監(jiān)督的工作。OCR處理一般使用性能較好的PC機,OCR處理程序一經啟動會自動掃描數(shù)據(jù)庫中的憑證影像,發(fā)現(xiàn)有需OCR處理而未處理的,提取到本地進行處理。   

OCR手寫體、印刷體識別技術,能識別不同人寫的千差萬別的手寫體漢字和數(shù)字,應用于本系統(tǒng),識別憑證影像中儲戶填寫的信息,如大寫金額、小寫金額、帳號、存期、日期、證件號等,可以代替手工錄入。同時被識別得出的金額還要與流水識別所得的金額進行核對,核對成功,則OCR識別成功。這樣處理是為了避免誤判。   

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 揭阳市| 乌兰浩特市| 都安| 揭西县| 白朗县| 惠东县| 淅川县| 建瓯市| 航空| 修武县| 宜兰县| 连平县| 河源市| 岚皋县| 大竹县| 迁安市| 天水市| 牟定县| 青岛市| 金阳县| 三原县| 富平县| 潞城市| 东台市| 文成县| 宜黄县| 玉林市| 云阳县| 特克斯县| 万山特区| 百色市| 汪清县| 洛隆县| 南木林县| 新津县| 读书| 仪征市| 阳朔县| 宁夏| 蒲城县| 九寨沟县|