百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

OpenCV常用图片转换技巧(opencv jpg转bmp)

toyiye 2024-08-17 23:43 27 浏览 0 评论

在进行计算机视觉模型训练前,我们经常会用到图像增强的技巧来获取更多的样本,但是有些深度学习框架中的方法对图像的变化方式可能并不能满足我们的需求,所以掌握OpenCV中一些常用的图像处理技巧对我们还是有不少帮助的。主要内容如下:

  • 图片读取(单通道、三通道)
  • 图片修改(剪切、旋转、通道分离)
  • 常用的变换(伽马修正、仿射变换)
  • 总结

开始之前先安装好 Opencv,并导入我们要用到的包:

import cv2
import random
import numpy as np
from matplotlib import pyplot as plt

1. 图片读取

首先使用OpenCV中的 imread 函数来进行单通道图像的读取,使用 imshow 显示读取的图像:

img_gray = cv2.imread('img.jpg', 0)
cv2.imshow("jrs",img_gray)

key = cv2.waitKey()
if key == 27:
 cv2.destroyAllWindows()

显示的结果如下,是一个灰度图:

还可以查看我们图像的一些基本属性:

print(img_gray)
print(img_gray.dtype)
print(img_gray.shape)

我们在来看下三通道的图像读取方式,只需要将 imread 中第二个参数去掉:

img = cv2.imread('img.jpg') 
cv2.imshow("img",img) 

key = cv2.waitKey() 
if key == 27:
 cv2.destroyAllWindows()

结果如下:

同样,我们可以再次查看图像的基本属性,会发现如下两个已经发生了变化。

print(img_gray)
print(img_gray.shape)

2. 图片修改

2.1 图像的裁剪

裁剪最简单的方式是获取图像数组的切片,如下:

img_crop = img[100:300,100:300]
cv2.imshow("img_crop", img_crop)

key = cv2.waitKey()
if key == 27:
 cv2.destroyAllWindows()

得到的结果如下:

2.2 图像通道分离

我们知道每个图像是由 RGB 三个颜色通道构成,所以我们可以使用 split 函数对原图像的三个通道进行分离:

B, G, R = cv2.split(img)

进行通道分离的后,我们就可以在每个通道上独立的进行数值变换,变换完成后再组合来生成新的图像。比如提升图像的亮度:

B,G,R = cv2.split(img)
for i in (B,G,R):
 randint = random.randint(50,100)
 limit = 255-randint
 i[i>limit]=255
 i[i<=limit]=randint+i[i<=limit]
 img_merge = cv2.merge((B,G,R))
cv2.imshow("img_merge",img_merge)

key = cv2.waitKey()
if key==27:
 cv2.destroyAllWindows()

得到的效果如下:

2.3 图像旋转

还可以使用 warpAffine 函数根据我们的设定的角度完成图像的旋转:

M = cv2.getRotationMatrix2D((img.shape[1] / 2, img.shape[0] / 2), 30, 1)
img_rotate = cv2.warpAffine(img, M, (img.shape[1], img.shape[0]))
cv2.imshow('img_rotate', img_rotate)

key = cv2.waitKey(0)
if key == 27:
 cv2.destroyAllWindows()

这里我们不对图像进行缩放,旋转角度为30度,最后得到的效果如下:

3. 常用的变换

3.1 仿射变换

仿射变换允许图像倾斜并且可以在任意两个方向上发生伸缩。代码如下:

def random_warp(img, row, col):
 height, width, channels = img.shape
 random_margin = 100
 x1 = random.randint(-random_margin, random_margin)
 y1 = random.randint(-random_margin, random_margin)
 x2 = random.randint(width - random_margin - 1, width - 1)
 y2 = random.randint(-random_margin, random_margin)
 x3 = random.randint(width - random_margin - 1, width - 1)
 y3 = random.randint(height - random_margin - 1, height - 1)
 x4 = random.randint(-random_margin, random_margin)
 y4 = random.randint(height - random_margin - 1, height - 1)
 dx1 = random.randint(-random_margin, random_margin)
 dy1 = random.randint(-random_margin, random_margin)
 dx2 = random.randint(width - random_margin - 1, width - 1)
 dy2 = random.randint(-random_margin, random_margin)
 dx3 = random.randint(width - random_margin - 1, width - 1)
 dy3 = random.randint(height - random_margin - 1, height - 1)
 dx4 = random.randint(-random_margin, random_margin)
 dy4 = random.randint(height - random_margin - 1, height - 1)
 pts1 = np.float32([[x1, y1], [x2, y2], [x3, y3], [x4, y4]])
 pts2 = np.float32([[dx1, dy1], [dx2, dy2], [dx3, dy3], [dx4, dy4]])
 
 
 M_warp = cv2.getPerspectiveTransform(pts1, pts2)
 img_warp = cv2.warpPerspective(img, M_warp, (width, height))
 return img_warp

img_warp = random_warp(img, img.shape[0], img.shape[1])
cv2.imshow('img_warp', img_warp)

key = cv2.waitKey(0)
if key == 27:
 cv2.destroyAllWindows()

运行后的效果如下:

3.2 伽马修正

伽马修正提升图像的对比度,让图像看起来更加的“明亮”。代码如下:

def adjust_gamma(image, gamma=1.0):
 invGamma = 1.0/gamma
 table = []
 for i in range(256):
 table.append(((i / 255.0) ** invGamma) * 255)
 table = np.array(table).astype("uint8")
 return cv2.LUT(image, table)

img_gamma = adjust_gamma(img, 2)
cv2.imshow("img",img)
cv2.imshow("img_gamma",img_gamma)

key = cv2.waitKey()
if key == 27:
 cv2.destroyAllWindows()

运行后的效果如下:

4. 总结

通过上面的方法已经能够满足我们绝大多数的图像增强需求了,当然和可以组合使用。

如果您觉得有所收获,请点个赞吧。

相关推荐

# Python 3 # Python 3字典Dictionary(1)

Python3字典字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中,格式如...

Python第八课:数据类型中的字典及其函数与方法

Python3字典字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值...

Python中字典详解(python 中字典)

字典是Python中使用键进行索引的重要数据结构。它们是无序的项序列(键值对),这意味着顺序不被保留。键是不可变的。与列表一样,字典的值可以保存异构数据,即整数、浮点、字符串、NaN、布尔值、列表、数...

Python3.9又更新了:dict内置新功能,正式版十月见面

机器之心报道参与:一鸣、JaminPython3.8的热乎劲还没过去,Python就又双叒叕要更新了。近日,3.9版本的第四个alpha版已经开源。从文档中,我们可以看到官方透露的对dic...

Python3 基本数据类型详解(python三种基本数据类型)

文章来源:加米谷大数据Python中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。在Python中,变量就是变量,它没有类型,我们所说的"类型"是变...

一文掌握Python的字典(python字典用法大全)

字典是Python中最强大、最灵活的内置数据结构之一。它们允许存储键值对,从而实现高效的数据检索、操作和组织。本文深入探讨了字典,涵盖了它们的创建、操作和高级用法,以帮助中级Python开发...

超级完整|Python字典详解(python字典的方法或操作)

一、字典概述01字典的格式Python字典是一种可变容器模型,且可存储任意类型对象,如字符串、数字、元组等其他容器模型。字典的每个键值key=>value对用冒号:分割,每个对之间用逗号,...

Python3.9版本新特性:字典合并操作的详细解读

处于测试阶段的Python3.9版本中有一个新特性:我们在使用Python字典时,将能够编写出更可读、更紧凑的代码啦!Python版本你现在使用哪种版本的Python?3.7分?3.5分?还是2.7...

python 自学,字典3(一些例子)(python字典有哪些基本操作)

例子11;如何批量复制字典里的内容2;如何批量修改字典的内容3;如何批量修改字典里某些指定的内容...

Python3.9中的字典合并和更新,几乎影响了所有Python程序员

全文共2837字,预计学习时长9分钟Python3.9正在积极开发,并计划于今年10月发布。2月26日,开发团队发布了alpha4版本。该版本引入了新的合并(|)和更新(|=)运算符,这个新特性几乎...

Python3大字典:《Python3自学速查手册.pdf》限时下载中

最近有人会想了,2022了,想学Python晚不晚,学习python有前途吗?IT行业行业薪资高,发展前景好,是很多求职群里严重的香饽饽,而要进入这个高薪行业,也不是那么轻而易举的,拿信工专业的大学生...

python学习——字典(python字典基本操作)

字典Python的字典数据类型是基于hash散列算法实现的,采用键值对(key:value)的形式,根据key的值计算value的地址,具有非常快的查取和插入速度。但它是无序的,包含的元素个数不限,值...

324页清华教授撰写【Python 3 菜鸟查询手册】火了,小白入门字典

如何入门学习python...

Python3.9中的字典合并和更新,了解一下

全文共2837字,预计学习时长9分钟Python3.9正在积极开发,并计划于今年10月发布。2月26日,开发团队发布了alpha4版本。该版本引入了新的合并(|)和更新(|=)运算符,这个新特性几乎...

python3基础之字典(python中字典的基本操作)

字典和列表一样,也是python内置的一种数据结构。字典的结构如下图:列表用中括号[]把元素包起来,而字典是用大括号{}把元素包起来,只不过字典的每一个元素都包含键和值两部分。键和值是一一对应的...

取消回复欢迎 发表评论:

请填写验证码