今天我们将讨论使用Python中的OpenCV库对图像执行的一些基本操作。从在Windows中安装python3开始,在Python脚本中执行基本操作。
图像处理通常是指对图像的技术分析,例如为了得到增强的图像/或提取一些有用的信息而进行的一些操作。
随着我们的发展,许多应用程序使用图像/帧/视频作为输入,需要对它们进行预处理,并将其输入设备、软件或脚本。
应用
图像处理可以是娱乐性的,可用于许多应用:
1.它可以用来调整图像的大小,以适应网页所需的大小,并可使他们锐化;
2.旧的黑白图像可以变成彩色照片,或者最新的彩色照片可以通过着色技术使其看起来像旧的黑白照片;
3.可以用来增强医学影像学检查病人的癌症或其他疾病。
基本图像处理技术
在本文中,我们将看到从目录中读取图像、修改图像并将其存储在另一个目录中的函数。下面是我们要讨论的主要内容。
?使用Python和OpenCV读取图像
?使用OpenCV调整图像大小
?模糊/平滑图像
?锐化图像
?边缘检测算法(Canny)
基本要求和安装:
1.装有Windows的电脑/个人电脑/笔记本电脑;
2.Python软件:可以按照这里提到的程序进行下载和安装(https://prudhvistark.medium.com/how-to-use-connect-bluetooth-in-python-from-scartch-to-bosch-glm-50-c-in-window-e75d8206fab4)。(主要尝试从这里下载并安装最新版本:https://www.python.org/downloads/);
3.如果你还没有这样做,请下载并安装VS Code(https://code.visualstudio.com/);
4.接下来,从Visual Studio Marketplace安装Python扩展。Python扩展名为Python,由Microsoft发布;
5.通过在CMD(命令提示符)中发出以下命令,安装opencv python(这是一个用于python的非正式预构建opencv包):
pip install PACKAGE_NAME
PACKAGE_NAME可以是:
?opencv-python(只包含主模块)
?opencv-contrib-python(包含main和contrib模块)
?opencv-python-headless(与opencv-python相同,但没有GUI功能)
?opencv-contrib-python-headless(与opencv-contrib-python相同,但没有GUI功能)
设置完成后:
1.打开一个目录,创建一个“Image_Processing”文件夹;
2.下载少量图像(3-4个图像)并保存在该文件夹中;
3.创建一个Python脚本文件“Test_img_processing.py“(.py是python脚本的扩展)。
实现与执行:
现在你可以自由使用python脚本了,请始终在导入所需库的情况下启动脚本。下面是进行基本图像处理的函数。
1.要读取图像,我们有一个函数“imread()”,它将图像文件名作为字符串和标志。
imread(/complete/path/to/image,flag)
第一个参数是指向图像的完整路径以及扩展名;
第二个参数是可选标志,可以是以下任意一个:
cv2.IMREAD_COLOR:加载彩色图像。图像的任何透明度都将被忽略。它是默认标志;
cv2.IMREAD_GRAYSCALE:以灰度模式加载图像;
cv2.IMREAD_UNCHANGED:加载图像,包括alpha通道;
返回numpy数组,包含像素值。对于彩色图像,每个像素都表示为一个包含红色、绿色和蓝色通道的数组。
注意,默认标志是cv2.IMREAD_COLOR。因此,即使读取具有透明度的png图像,透明通道也会被忽略。
2.要显示读取的图像,我们使用“imshow()”。
cv2.imshow(window_name, image)
第一个参数是显示图像时显示的窗口的名称;
第二个参数是要在窗口中显示的图像。
3.为了将读取的图像保存到另一个目录中,我们使用“imwrite()”,它接受目标和图像文件。
cv2.imwrite(‘/path/to/destination/image.png’,image)
第一个参数是指向文件系统上的目标的路径,应该在该位置保存图像;
第二个参数是包含图像的ndarray
如果图像写入文件系统,则返回True,否则返回False。
4.为了得到图像的尺寸,我们有一个称为形状的属性。
img = cv2.imread(‘/home/img/python.png’, cv2.IMREAD_UNCHANGED)
# 获取图像的尺寸
dimensions = img.shape
# 高度、宽度、通道
height = img.shape[0]
width = img.shape[1]
channels = img.shape[2]
img.shape返回(高度、宽度、通道数):
高度表示图像中的像素行数或图像数组的每列中的像素数;
宽度表示图像中的像素列数或图像数组中每行的像素数;
通道数表示用于表示每个像素的组件数。
5.为了模糊图像,我们使用“cv2.Blur()”,它接受图像和滤波器。这里使用“平均”。还有其他选择:
?高斯模糊
?中值模糊
?双边滤波
包含所有基本功能的示例脚本:
# 导入opencv CV2模块
import cv2
# bat.jpg 是蝙蝠侠的图片.
img = cv2.imread(‘bat.jpg’)
# 确保已将其保存在同一文件夹中
# 平均
# 你可以随意改变核大小
Averaging_blur= cv2.blur(img,(10,10))
cv2.imshow(‘Averaging’,Averaging_blur)
cv2.waitKey(0)# 等待窗口关闭
# 高斯模糊
# 你可以随意改变核大小
Gaussian_Blur= cv2.GaussianBlur(img, (5,5),0)
cv2.imshow(‘Gaussian Blurring’, Gaussian_Blur)
cv2.waitKey(0)#waits for the window to close
# 中值模糊
Median_Blur= cv2.medianBlur(img,5)
cv2.imshow(‘Median Blurring’, Median_Blur)
cv2.waitKey(0)# 等待窗口关闭
# 双边滤波
Bilateral_Filter= cv2.bilateralFilter(img,9,75,75)
cv2.imshow(‘Bilateral Filtering’, Bilateral_Filter)
cv2.waitKey(0) # 等待窗口关闭
cv2.destroyAllWindows()# 关闭此会话中所有打开的窗口
6.为了检测图像的边缘,我们使用了流行的canny边缘检测算法。OpenCV有一个内置函数cv2.Canny(),它将输入图像作为第一个参数,其光圈大小(最小值和最大值)作为最后两个参数。
edges = cv2.Canny(frame,100,200)
# 在框架中显示边
cv2.imshow('Edges',edges)
使用opencv和python有更多的操作和开放算法来执行图像的特定功能,这些操作和算法可以非常容易和灵活地在实时视频/帧中实现。