【HiSpark IPC DIY Camera试用连载】第三篇分水岭算法测试

小嵌 · 发表于 2021-1-21 23:55:48

【HiSpark IPC DIY Camera试用连载】第三篇分水岭算法测试,

本帖最后由瑟寒凌风于 2021-1-21 23:39 编辑

本文测试一下分水岭算法，使用python调用opencv和numpy处理数据。

分水岭算法主要用于图像分段，通常是把一副彩色图像灰度化，然后再求梯度图，最后在梯度图的基础上进行分水岭算法，求得分段图像的边缘线。分水岭算法的思想来源于地形学，它将图像看作是地形学上被水覆盖的自然地貌，图像中的每一像素的灰度值表示该点的海拔高度，其每一个局部极小值及其影响区域称为集水盆地，两集水盆地的边界则为分水岭。
通常描述分水岭变换有两种方法：一种是“雨滴法”，另一种方法是模拟“溢流”的过程。

分水岭的计算过程是一个迭代标注过程。分水岭比较经典的计算方法是L. Vincent提出的。在该算法中，分水岭计算分两个步骤，一个是排序过程，一个是淹没过程。首先对每个像素的灰度级进行从低到高排序，然后在从低到高实现淹没过程中，对每一个局部极小值在h阶高度的影响域采用先进先出（FIFO）结构进行判断及标注。

首先我们画几个图形，如下图

2.jpg （22.03 KB, 下载次数: 0）

下载附件保存到相册

24 分钟前上传

这是我随手画的，使用的win10的画图工具。我们编程实现图形边界的识别。分水岭简单来说，就是识别图像轮廓的一种算法，好在python中已经实现了该算法。分水岭算法是使用很多算法叠加的总和，python的简单之处在此可见一斑。

def getStructuringElement（shape: Any, # 形状
ksize: Any, # kernel尺寸
anchor: Any = None） -> None

复制代码
该函数用于获取结构化元素，然后可以进行形态学的操作，比如开闭运算，膨胀腐蚀等。其中的两个参数，一个是原始图像，一个是核。核这个东西就不介绍了，原理不复杂，一说一大堆。

def morphologyEx（src: Any,
op: Any,
kernel: Any,
dst: Any = None,
anchor: Any = None,
iterations: Any = None,
borderType: Any = None,
borderValue: Any = None） -> None

复制代码
该函数用于形态学滤波，其参数在代码中都列出来了的。

def dilate（src: Any,
kernel: Any,
dst: Any = None,
anchor: Any = None,
iterations: Any = None,
borderType: Any = None,
borderValue: Any = None） -> None

复制代码
该函数用于图像的膨胀操作，通过相邻像素范围内的局部极大运算来膨胀一张图片，从参数src输入，dst输出，其中第二个参数就是前面的核。

def distanceTransform（src: Any,
distanceType: Any,
maskSize: Any,
dst: Any = None,
dstType: Any = None） -> None

复制代码
上面函数是二值化函数，用于对图像的二值化操作，这是个常用函数。图像二值化是将图像上的像素点的灰度值设置为0或255，也就是将整个图像呈现出明显的黑白效果的过程。

def subtract（src1: Any,
src2: Any,
dst: Any = None,
mask: Any = None,
dtype: Any = None） -> None

复制代码
该函数为图像相减操作，是将二值化的图像使用相应位置的像素进行相减操作。

def watershed（image: Any,
markers: Any） -> None

复制代码
该函数是分水岭的基本函数，算法使用效果主要就是该函数完成，其参数在代码的注释中已经标注出来了。
其效果如下图所示，在圆形的边界位置，已经用细小的红线在绘制出识别区域。

1.jpg （70.92 KB, 下载次数: 0）

下载附件保存到相册

19 分钟前上传

源代码如下

# -*- coding: utf-8 -*-
import cv2
import numpy as np
camera = cv2.VideoCapture（0）
# 判断视频是否打开
if （camera.isOpened（））:
print（\“Open\“）
else:
print（\“摄像头未打开\“）
# 测试用,查看视频size
size = （int（camera.get（cv2.CAP_PROP_FRAME_WIDTH））,
int（camera.get（cv2.CAP_PROP_FRAME_HEIGHT）））
print（\“size:\“ + repr（size））
while True:
# 读取视频流
grabbed, frame_lwpCV = camera.read（）
gray_lwpCV = cv2.cvtColor（frame_lwpCV, cv2.COLOR_BGR2GRAY）
ret, binary = cv2.threshold（gray_lwpCV, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU） # 二值化
cv2.imshow（“binary_image“, binary）
kernel = cv2.getStructuringElement（cv2.MORPH_RECT, （3, 3）） # 产生一个kernel
\“\“\“
def getStructuringElement（shape: Any, # 形状
ksize: Any, # kernel尺寸
anchor: Any = None） -> None
\“\“\“
mb = cv2.morphologyEx（binary, cv2.MORPH_OPEN, kernel, iterations=2） # 形态学操作
\“\“\“
def morphologyEx（src: Any, # 原图像
op: Any, # 操作类型
# MORPH_ERODE = 0, //腐蚀
# MORPH_DILATE = 1, //膨胀
# MORPH_OPEN = 2, //开操作
# MORPH_CLOSE = 3, //闭操作
# MORPH_GRADIENT = 4, //梯度操作
# MORPH_TOPHAT = 5, //顶帽操作
# MORPH_BLACKHAT = 6, //黑帽操作
# MORPH_HITMISS = 7
kernel: Any, # 用于膨胀操作的结构元素，kernel
dst: Any = None,
anchor: Any = None, # 参考点
iterations: Any = None,
borderType: Any = None,
borderValue: Any = None） -> None
MORPH_OPEN（开），内部就是进行了先腐蚀后膨胀的操作。
MORPH_CLOSE（闭），其实内部就是进行了先膨胀后腐蚀的操作。
MORPH_GRADIENT（梯度），内部是膨胀减去腐蚀。
\“\“\“
sure_bg = cv2.dilate（mb, kernel, iterations=3） # 对输入图像用特定结构元素进行膨胀操作
\“\“\“
def dilate（src: Any,
kernel: Any,
dst: Any = None,
anchor: Any = None,
iterations: Any = None,
borderType: Any = None,
borderValue: Any = None） -> None
\“\“\“
cv2.imshow（“mor_opt“, sure_bg）
# 距离变换
dist = cv2.distanceTransform（mb, cv2.DIST_L2, 3） # 距离变换
\“\“\“
def distanceTransform（src: Any, # 二值化图像
distanceType: Any, # 计算距离的类型，CV_DIST_L1、CV_DIST_L2 、CV_DIST_C
maskSize: Any, # 距离变换掩码矩阵的大小
dst: Any = None,
dstType: Any = None） -> None
\“\“\“
dist_output = cv2.normalize（dist, 0, 1.0, cv2.NORM_MINMAX）
cv2.imshow（“distance_t“, dist_output * 50）
ret, suRFace = cv2.threshold（dist, dist.max（） * 0.6, 255, cv2.THRESH_BINARY）
cv2.imshow（“surface_bin“, surface）
surface_fg = np.uint8（surface）
unknown = cv2.subtract（sure_bg, surface_fg） # 图像的相减操作
\“\“\“
def subtract（src1: Any,
src2: Any,
dst: Any = None,
mask: Any = None, # 可选操作掩码; 这是一个8位单通道数组，用于指定要更改的输出数组的元素。
dtype: Any = None） -> None # 输出阵列的可选深度
\“\“\“
ret, markers = cv2.connectedComponents（surface_fg） # 连通域标识
\“\“\“
def connectedComponents（image: Any, # image是threshold得到的二值图
labels: Any = None,
connectivity: Any = None,
ltype: Any = None） -> None
\“\“\“
print（ret）
# 分水岭
markers = markers + 1
markers[unknown == 255] = 0
markers = cv2.watershed（frame_lwpCV, markers=markers）
\“\“\“
def watershed（image: Any,
markers: Any） -> None
第二个入参markers必须包含了种子点信息。
在执行分水岭函数watershed之前，必须对第二个参数markers进行处理，它应该包含不同区域的轮廓，
每个轮廓有一个自己唯一的编号，轮廓的定位可以通过Opencv中findContours方法实现，这个是执行
分水岭之前的要求。接下来执行分水岭会发生什么呢？算法会根据markers传入的轮廓作为种子（也就是
所谓的注水点），对图像上其他的像素点根据分水岭算法规则进行判断，并对每个像素点的区域归属进行划
定，直到处理完图像上所有像素点。而区域与区域之间的分界处的值被置为“-1”，以做区分。
\“\“\“
frame_lwpCV[markers == -1] = [0, 0, 255]
cv2.imshow（“result_image“, frame_lwpCV）
key = cv2.waitKey（1） & 0xFF
# 按\“q\“健退出循环
if key == ord（\“q\“）:
break
# When everything done, release the capture
camera.release（）
cv2.destroyAllWindows（）