国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python3.6使用tesseract-ocr的正確方法

2020-01-04 14:19:53
字體:
來源:轉載
供稿:網友

Tesseract介紹

tesseract是一個挺不錯的OCR引擎,目前的問題是最新的中文資料相對較少,過時、不準確的信息偏多。

tesseract是一個google支持的開源ocr項目,其項目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源碼可以在這里下載。

實際使用tesseract ocr也有兩種方式:1. 動態庫方式 libtesseract  2. 執行程序方式 tesseract.exe

環境

  • Python 3.6.3
  • pip 9.0.1
  • tesseract-ocr-setup-3.05.00dev.exe
  • Windows10

安裝

1.tesseract-orc

  • Tesseract:開源的OCR識別引擎,初期Tesseract引擎由HP實驗室研發,后來貢獻給了開源軟件業,后經由Google進行改進,消除bug,優化,重新發布。

安裝的時候需要自行選擇安裝的語言,一些其他國家的語言可以不選擇安裝,我之按安裝了中文,英文和日語。安裝過程和其他軟件一樣。

2.pytesseract

pip install pytesseract

配置環境

1.設置 tesseract-orc路徑

默認情況下tesseract-orc是不被添加到系統的path路徑的,這樣在使用的時候發生FileNotFoundError: [WinError 2] 系統找不到指定的文件錯誤。

解決方法:

  • 方法1:將 C:/Program Files (x86)/Tesseract-OCR添加到系統路徑(路徑因安裝過程而異)
  • 方法2:修改pytesseract.py文件

設置訓練集的位置

下載的默認訓練集也沒有添加到系統路徑,會報錯

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file //Program Files (x86)//Tesseract-OCR//tessdata/chi_sim.traineddata')

解決方法:

設置環境變量 TESSDATA_PREFIX 
C:/Program Files (x86)/Tesseract-OCR/tessdata

實例程序

import pytesseractfrom PIL import Imageimage = Image.open('test.png')code = pytesseract.image_to_string(image)print(code)

更多參考:https://pypi.python.org/pypi/pytesseract

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對VEVB武林網的支持。


注:相關教程知識閱讀請移步到python教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 金昌市| 通许县| 平乐县| 赤壁市| 卢湾区| 卢氏县| 专栏| 塔城市| 镇宁| 宣威市| 潮州市| 万安县| 乌兰浩特市| 南宁市| 安岳县| 石屏县| 铜陵市| 吴旗县| 阿合奇县| 武宣县| 句容市| 荔浦县| 天等县| 陆良县| 元氏县| 嘉禾县| 织金县| 台南县| 辛集市| 乌什县| 温泉县| 扶绥县| 台前县| 通化县| 昌黎县| 襄樊市| 灵川县| 元阳县| 姚安县| 吴忠市| 陵川县|