現在的人臉識別技術已經得到了非常廣泛的應用,支付領域、身份驗證、美顏相機里都有它的應用。用iPhone的同學們應該對下面的功能比較熟悉
iPhone的照片中有一個“人物”的功能,能夠將照片里的人臉識別出來并分類,背后的原理也是人臉識別技術。
這篇文章主要介紹怎樣用Python實現人臉檢測。人臉檢測是人臉識別的基礎。人臉檢測的目的是識別出照片里的人臉并定位面部特征點,人臉識別是在人臉檢測的基礎上進一步告訴你這個人是誰。
好了,介紹就到這里。接下來,開始準備我們的環境。
準備工作
本文的人臉檢測基于dlib,dlib依賴Boost和cmake,所以首先需要安裝這些包,以Ubuntu為例:
$ sudo apt-get install build-essential cmake $ sudo apt-get install libgtk-3-dev $ sudo apt-get install libboost-all-dev
我們的程序中還用到numpy,opencv,所以也需要安裝這些庫:
$ pip install numpy $ pip install scipy $ pip install opencv-python $ pip install dlib
人臉檢測基于事先訓練好的模型數據,從這里可以下到模型數據
http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
下載到本地路徑后解壓,記下解壓后的文件路徑,程序中會用到。
dlib的人臉特征點
上面下載的模型數據是用來估計人臉上68個特征點(x, y)的坐標位置,這68個坐標點的位置如下圖所示
我們的程序將包含兩個步驟:
第一步,在照片中檢測人臉的區域
第二部,在檢測到的人臉區域中,進一步檢測器官(眼睛、鼻子、嘴巴、下巴、眉毛)
人臉檢測代碼
我們先來定義幾個工具函數:
def rect_to_bb(rect): x = rect.left() y = rect.top() w = rect.right() - x h = rect.bottom() - y return (x, y, w, h)
這個函數里的rect是dlib臉部區域檢測的輸出。這里將rect轉換成一個序列,序列的內容是矩形區域的邊界信息。
def shape_to_np(shape, dtype="int"): coords = np.zeros((68, 2), dtype=dtype) for i in range(0, 68): coords[i] = (shape.part(i).x, shape.part(i).y) return coords
這個函數里的shape是dlib臉部特征檢測的輸出,一個shape里包含了前面說到的臉部特征的68個點。這個函數將shape轉換成Numpy array,為方便后續處理。
def resize(image, width=1200): r = width * 1.0 / image.shape[1] dim = (width, int(image.shape[0] * r)) resized = cv2.resize(image, dim, interpolation=cv2.INTER_AREA) return resized
新聞熱點
疑難解答