python opencvの顔検出は完璧ではない - hanamichi

傾いた顔の画像は検出できないことを確認していく。

f:id:hanamichi_sukusuku:20201222193514p:plain

実行結果

f:id:hanamichi_sukusuku:20201222193533p:plain

import matplotlib.pyplot as plt
import cv2
from scipy import ndimage

まずモジュール読み込み。

scipyはpythonの科学技術計算ライブラリでnumpyがないと使えない。

簡単に言えば高度な計算ができるライブラリ。

次に検出器と画像の読み込み

# 検出器と画像の読み込み
cascade_file = "haarcascade_frontalface_alt.xml"
cascade = cv2.CascadeClassifier(cascade_file)
img = cv2.imread("girl.jpg")

カスケードファイルをcv2.CascadeClassifierに引数として渡して検出器を作成。

# 顔検出を実行し、印をつける
def face_detect(img):
 img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
 face_list = cascade.detectMultiScale(img_gray, minSize=(300,300))
# 認識した部分に印をつける
for (x,y,w,h) in face_list:
print("顔の座標=", x, y, w, h)
 red = (0, 0, 255)
 cv2.rectangle(img, (x, y), (x+w, y+h), red, thickness=30)

この関数に関しては、引数で画像データを渡してグレイスケールに変換。

cascade.detectMultiScaleメソッドで検出を行っている。

その後、検出されたデータの顔座標の表示とcv2.rectangleで元の画像に長方形で検出したデータを描画している。

cv2.rectangleは長方形描画するときに使う。

cv2.rectangle(描画する画像,(左上からのx座標, y座標),(x+w(幅), y+h(高さ)),色,線の太さとかオプション)

thicknessは線の太さを変えるオプション。

# 角度毎に検証する
for i in range(0, 9):
 ang = i * 10
print("---" + str(ang) + "---")
 img_r = ndimage.rotate(img, ang)
 face_detect(img_r)
 plt.subplot(3, 3, i + 1)
 plt.axis("off")
 plt.title("angle=" + str(ang))
 plt.imshow(cv2.cvtColor(img_r, cv2.COLOR_BGR2RGB))
 
plt.show()