Python3實現(xiàn)獲取圖片文字里中文的方法分析

2020-02-16 00:07:09

字體：大中小

來源：轉載

供稿：網(wǎng)友

本文實例講述了Python3實現(xiàn)獲取圖片文字里中文的方法。分享給大家供大家參考，具體如下：

一、運行環(huán)境

(1) win10

(2) pycharm

(3) python 3.5

(4) pillow與pytesseract庫安裝：

pip3 install pillowpip3 install pytesseract

(5) 識別引擎tesseract-ocr ，下載之后解壓安裝，下載地址：https://www.jb51.net/softs/538925.html

二、運行代碼

# -*- coding: utf-8 -*-from PIL import Imageimport pytesseract#上面都是導包，只需要下面這一行就能實現(xiàn)圖片文字識別text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #設置為中文文字的識別#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng')  #設置為英文或阿拉伯字母的識別print(text)

三、報錯解決

1.FileNotFoundError:[WinError 2]系統(tǒng)找不到指定文件。

解決辦法：

打開文件pytesseract.py，找到如下代碼，將tesseract_cmd的值修改為全路徑，再次使用就不會報這個錯了。

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file//Progr

解決辦法：

打開文件pytesseract.py,找到image_to_string,指定config的參數(shù)，如下：

tessdata_dir_config = '--tessdata-dir "C://Program Files (x86)//Tesseract-OCR//tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):

更多關于Python相關內容感興趣的讀者可查看本站專題：《Python數(shù)據(jù)結構與算法教程》、《Python編碼操作技巧總結》、《Python函數(shù)使用技巧總結》、《Python字符串操作技巧匯總》及《Python入門與進階經(jīng)典教程》

希望本文所述對大家Python程序設計有所幫助。

上一篇：詳解Python with/as使用說明

下一篇：對python產(chǎn)生隨機的二維數(shù)組實例詳解