OpenCV
OpenCV是計算機視覺領域最流行的庫之一。它最初是用 C 和 C++ 編寫的?,F在也可以在 Python/ target=_blank class=infotextkey>Python 中使用。它最初是由英特爾開發的。該庫是一個跨平臺的開源庫。免費使用。OpenCV 庫是一個高度優化的庫,其主要重點是實時應用程序。
OpenCV 庫是2500多個優化算法的組合。它可以用來檢測和識別不同的人臉,在圖像中或實時識別物體,使用視頻和網絡攝像頭分類不同的人類行為,跟蹤攝像機的運動,跟蹤像汽車、人類等移動物體,實時計數物體,將圖像拼接在一起產生高分辨率圖像,從圖像數據庫中找到類似的圖像,從使用閃光燈拍攝的圖像中去除紅眼,提高圖像質量,跟蹤眼球運動,跟蹤人臉等
它擁有大約4.7萬活躍用戶社區,估計下載量超過1800萬次。許多大公司,如谷歌,亞馬遜,特斯拉,微軟,本田等使用OpenCV,使他們的產品更好,更智能。
先決條件
在開始編寫代碼之前,我們需要在我們的設備上安裝 OpenCV 。如果你是專業的編程人員并且知道每一個 IDE,那么去 Pycharm 并且在設置中從它的包管理器中安裝 OpenCV-python。
如果您是初學者或中級程序員,或者只是想關注該博客,那么我們將使用代碼編輯器而不是IDE。只需轉到Visual Studio Code網站并根據您的操作系統下載最新版本即可?,F在,我們將創建一個虛擬環境,在其中將安裝 OpenCV。打開終端,然后使用cd定位到桌面。使用名為opencv的mkdir創建一個文件夾然后在以下命令中運行。
python -m venv env
現在使用 envscriptsactivate 命令激活環境,你會看到在 C:UsersusernameDesktopopencv 前出現一個帶小括號的 (env)。現在只需使用 pip 安裝 OpenCV。
pip install opencv-python
我們將在這個博客中涵蓋7個主題:
- 讀、寫和展示一個圖像
- 讀取視頻與集成網絡攝像頭
- 縮放和裁剪圖像
- 使用函數的基本圖像濾波器
- 繪制不同的形狀
- 在圖像上寫文字
- 檢測和裁剪人臉
1.讀、寫和展示一個圖像
為了使用 OpenCV 讀取圖像,我們使用函數 imread() ,為了顯示圖像,我們使用函數 imshow() ,為了寫入圖像,我們使用函數 imwrite()。讓我們看看每一個的語法。
imread():
img = cv2.imread("PATH_TO_IMAGE.jpg/png")
Example
img = imread("images/dog0.jpg")
imshow():
cv2.imshow("WINDOW NAME",IMG_VAR)
Example
imshow("Dog Image",img)
imwrite():
cv2.imwrite(FILENAME, IMAGE)
filename: A string representing the file name. The filename must include image format like .jpg, .png, etc.
image: It is the image that is to be saved.
Example
cv2.imwrite('images/img',img)
.讀取視頻與集成網絡攝像頭
讀取視頻文件與讀取 OpenCV 中的圖像文件非常相似。不同之處在于我們使用 cv2.videocapture()
語法:
video = cv2.VideoCapture("FILEPATH.mp4")
Example
video = cv2.VideoCapture("video/dog/dog.mp4")
視頻是許多幀圖像在一起的集合,每一幀都是一個圖像。要使用 OpenCV 觀看視頻,我們只需要使用 while 循環顯示視頻的每一幀。
while True:
success , img = cap.read()
cv2.imshow("Video",img)
if cv2.wAItKey(1) & 0xff==ord('q'):##key 'q' will break the loop
break
為了與網絡攝像頭集成,我們需要傳遞網絡攝像頭的端口值,而不是路徑到視頻。如果你使用的是筆記本電腦,沒有連接任何外部攝像頭,那么簡單地傳遞0,如果你連接了任何外部攝像頭,那么傳遞一個攝像頭端口值。
cap = cv2.VideoCapture(0)
cap.set(3,640) ## Frame width
cap.set(4,480) ## Frame Height
cap.set(10,100) ## Brightness
while True:
success, img = cap.read()
cv2.imshow("Video",img)
if cv2.waitKey(1) & 0xff == ord('q'):
break
3.縮放和裁剪圖像
(1) 縮放圖像
縮放是一個改變圖像形狀的過程。在 Opencv,我們可以使用 resize 函數來調整圖像的形狀。
語法:
cv2.resize(IMG,(WIDTH,HEIGHT))
IMG: image which we want to resize
WIDTH: new width of the resize image
HEIGHT: new height of the resize image
Example
cv2.resize(img,(224,224))
要調整圖像的大小,我們首先需要知道圖像的形狀。我們可以利用 shape 找到圖像的形狀,然后根據當前圖像的形狀,我們可以增大或減小圖像的大小。讓我們舉個例子來看看。
import cv2
img = cv2.imread("images/img0.jpg") ##Choose any image
print(img.shape)
imgResize = cv2.resize(img,(224,224)) ##Decrease size
imgResize2 = cv2.resize(img,(1024,1024)) ##Increase size
cv2.imshow("Image",img)
cv2.imshow("Image Resize",imgResize)
cv2.imshow("Image Increase size",imgResize2)
print(imgResize.shape)
cv2.waitKey(0)
如果您不想把圖像寬度和高度寫死,您也可以根據現有的形狀,然后根據比例改變圖像的寬度和高度。
import cv2
img = cv2.imread("images/img0.jpg") ##Choose any image
print(img.shape)
shape = img.shape
imgResize = cv2.resize(img,(shape[0]//2,shape[1]//2))##Decrease size
imgResize2 = cv2.resize(img,(shape[0]*2,shape[1]*2)) ##Increase size
cv2.imshow("Image",img)
cv2.imshow("Image Resize",imgResize)
cv2.imshow("Image Increase size",imgResize2)
print(imgResize.shape)
cv2.waitKey(0)
(2) 裁剪圖像
裁剪是獲取部分圖像的過程。在 OpenCV 中,我們可以通過定義裁剪后的矩形坐標來執行裁剪。
語法:
imgCropped = img[y1:y2, x1:x2](x1,y1): top-left vertex
(x2,y2): bottom-right vertex
Example
imgCropped = img[0:100,200:200]
使用裁剪方法,讓我們嘗試從圖像中提取 Monalisa 的臉。
import cv2
img = cv2.imread("images/img0.jpg")
imgCropped = img[50:250,120:330]
cv2.imshow("Image cropped",imgCropped)
cv2.imshow("Image",img)
cv2.waitKey(0)
您還可以使用繪畫模式來查找(x1,y1)、(x2,y2)的正確坐標。
這里有個小任務:
- 任務:右鍵單擊圖像并保存它; 嘗試從圖像中獲取國王卡。
- 提示:使用繪畫模式找到正確的坐標,最后,使用調整大小,以增加裁剪圖像的大小。
4.使用函數的基本圖像濾波器
我們可以在圖像上使用許多基本的濾波器,比如將圖片轉換成灰度、模糊等等。
(1) 從 Img 到 gray
為了將圖像從彩色圖像轉換為灰度圖像,我們可以使用函數 cv2.cvtColor,在這里我們傳遞 cv2.COLOR_BGR2GRAY 作為參數。
語法:
imgGray = cv2.cvtColor(IMG,cv2.CODE)
IMG: Original image
CODE: Conversion code for Gray(COLOR_BGR2GRAY)
Example
imgGray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
(2) 從 Img 到 HSV
為了將圖像轉換為 HSV 顏色空間,我們可以使用函數 cv2.cvtColor,這里我們傳遞 cv2.COLOR_BGR2HSV 作為參數。它主要用于目標跟蹤。
語法:
imgGray = cv2.cvtColor(IMG,cv2.CODE)
IMG: Original image
CODE: Conversion code for Gray(COLOR_BGR2HSV)
Example
imgHsv = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
(3) 模糊圖像
模糊用于去除圖像中的噪聲,也稱為平滑。它是對圖像應用低通濾波器的過程。在 OpenCV 中對圖像進行模糊,我們常用 GaussianBlur。
語法:
imgBlur = cv2.GaussianBlur(img,(sigmaX,sigmaY),kernalSize)
kernalsize − A Size object representing the size of the kernel.
sigmaX − A variable representing the Gaussian kernel standard deviation in X direction.
sigmaY - same as sigmaX
Exmaple
imgBlur = cv2.GaussianBlur(img,(3,3),0)
(4) 邊緣檢測
在 OpenCV 中,我們使用 Canny算子來檢測圖像中的邊緣。也有不同的邊緣檢測器,但最著名的是 Canny算子。Canny算子邊緣檢測是一種邊緣檢測算子,它使用多級算法來檢測圖像中的大范圍邊緣,是由 John F. Canny 在1986年提出的。
語法:
imgCanny = cv2.Canny(img,threshold1,threshold2)
threshold1,threshold2:Different values of threshold different for every images
Example
imgCanny = cv2.Canny(img,100,150)
(5) 膨脹
膨脹被用來增加圖像中邊緣的大小。首先,我們定義了奇數(5,5)的核矩陣大小。然后使用內核,我們對圖像執行膨脹。下面我們對 Canny 算子的輸出圖像進行了膨脹。
語法:
kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5
imgDialation = cv2.dilate(imgCanny,kernel,iterations=1) ##DIALATION
(6) 腐蝕
侵蝕與膨脹正好相反。該算法用于減小圖像中邊緣的大小。首先,我們定義了奇數(5,5)的核矩陣大小。然后使用內核,我們對圖像執行腐蝕。下面我們對 Canny 算子的輸出圖像進行腐蝕處理。
kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5
imgDialation = cv2.erode(imgCanny,kernel,iterations=1) ##EROSION
現在,在同一個程序中使用上述基本函數處理 Monalisa 圖像。
5.繪制不同的形狀
我們可以使用 OpenCV 繪制不同的形狀,像矩形,圓形,線等。
(1) 長方形:
要在圖像上繪制一個矩形,我們使用 cv2.rectangle 函數。在函數中,我們將寬度、高度、 x、 y、 RGB 中的顏色、深度作為參數傳遞。
語法:
cv2.rectangle(img,(w,h),(x,y),(R,G,B),THICKNESS)
w: width
h: height
x: distance from x axis
y: distance from y axis
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.rectangle(img,(100,300),(200,300),(255,0,255),2)
(2) 圓形:
為了繪制一個圓形,我們使用 cv2.circle 函數。我們傳遞 x,y,半徑大小,RGB 顏色,深度作為參數。
語法:
cv2.circle(img,(x,y),radius,(R,G,B),THICKNESS)
x: distance from x axis
y: distance from y axis
radius: size of radius(integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.circle(img,(200,130),90,(255,255,0),2)
(3) 直線:
要繪制一條直線,我們使用 cv2.line 函數傳遞起始點(x1,y1)、終點(x2,y2)、 RGB 格式的顏色、深度作為參數。
語法:
cv2.line(img,(x1,y1),(x2,y2),(R,G,B),THICKNESS)x1,y1: start point of line (integer)
x2,y2: end point of line (integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.line(img,(110,260),(300,260),(0,255,0),3)
6.在圖像上寫文字
在 OpenCV 中,我們有一個函數 cv2.puttext,用于在特定位置在圖像上寫入文本。它以圖像、文本、 x、 y、顏色、字體、字號、粗細作為輸入參數。
語法:
cv2.putText(img,text,(x,y),FONT,FONT_SCALE,(R,G,B),THICKNESS)
img: image to put text on
text: text to put on image
X: text distance from X axis
Y: text distance from Y axis
FONT: Type of FONT (ALL FONT TYPES)
FONT_SCALE: Scale of Font(Integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.putText(img,"HELLO",(120,250),cv2.FONT_HERSHEY_COMPLEX,1,(255,255,255),2)
7.檢測和裁剪人臉
人臉檢測在人臉識別系統中非常有用。在 OpenCV 中,我們有許多預先訓練的 haar 級聯分類器可用于不同的任務。以下網址可以查看 OpenCV Github 上的分類器列表:https://github.com/opencv/opencv/tree/master/data/haarca
scades。
我們使用 haarcascade_frontalface_default.xml 分類器來檢測圖像中的人臉。它將返回圖像的四個坐標(w,h,x,y)。使用這些坐標,我們要在臉上畫一個矩形,然后使用相同的坐標,繼續裁剪人臉。最后使用 imwrite,把裁剪后的圖像保存到目錄中。
import cv2
# Load the cascade
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# Read the input image
img = cv2.imread('images/img0.jpg')# Convert into grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Detect faces
faces = face_cascade.detectMultiScale(gray, 1.3, 4)# Draw rectangle around the faces
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
# Cropping Face
crop_face = img[y:y + h, x:x + w]
#Saving Cropped Face
cv2.imwrite(str(w) + str(h) + '_faces.jpg', crop_face)
cv2.imshow('img', img)
cv2.imshow("imgcropped",crop_face)
cv2.waitKey()