电子产业一站式赋能平台

PCB联盟网

搜索
查看: 1305|回复: 0
收起左侧

【HiSpark IPC DIY Camera试用连载 】第三篇 分水岭算法测试

[复制链接]

2607

主题

2607

帖子

7472

积分

高级会员

Rank: 5Rank: 5

积分
7472
发表于 2021-1-21 23:55:48 | 显示全部楼层 |阅读模式
【HiSpark IPC DIY Camera试用连载 】第三篇 分水岭算法测试,   
本帖最后由 瑟寒凌风 于 2021-1-21 23:39 编辑




本文测试一下分水岭算法,使用python调用opencv和numpy处理数据。


分水岭算法主要用于图像分段,通常是把一副彩色图像灰度化,然后再求梯度图,最后在梯度图的基础上进行分水岭算法,求得分段图像的边缘线。分水岭算法的思想来源于地形学,它将图像看作是地形学上被水覆盖的自然地貌,图像中的每一像素的灰度值表示该点的海拔高度,其每一个局部极小值及其影响区域称为集水盆地,两集水盆地的边界则为分水岭。
通常描述分水岭变换有两种方法:一种是“雨滴法”,另一种方法是模拟“溢流”的过程。


分水岭的计算过程是一个迭代标注过程。分水岭比较经典的计算方法是L. Vincent提出的。在该算法中,分水岭计算分两个步骤,一个是排序过程,一个是淹没过程。首先对每个像素的灰度级进行从低到高排序,然后在从低到高实现淹没过程中,对每一个局部极小值在h阶高度的影响域采用先进先出(FIFO)结构进行判断及标注。


首先我们画几个图形,如下图



2.jpg (22.03 KB, 下载次数: 0)

下载附件  保存到相册  

24 分钟前 上传


这是我随手画的,使用的win10的画图工具。我们编程实现图形边界的识别。分水岭简单来说,就是识别图像轮廓的一种算法,好在python中已经实现了该算法。分水岭算法是使用很多算法叠加的总和,python的简单之处在此可见一斑。

  • def getStructuringElement(shape: Any,   # 形状
      
  •                       ksize: Any,       # kernel尺寸
      
  •                       anchor: Any = None) -> None
      


复制代码
该函数用于获取结构化元素,然后可以进行形态学的操作,比如开闭运算,膨胀腐蚀等。其中的两个参数,一个是原始图像,一个是核。核这个东西就不介绍了,原理不复杂,一说一大堆。

  • def morphologyEx(src: Any,
      
  •                  op: Any,
      
  •                  kernel: Any,
      
  •                  dst: Any = None,
      
  •                  anchor: Any = None,
      
  •                  iterations: Any = None,
      
  •                  borderType: Any = None,
      
  •                  borderValue: Any = None) -> None
      


复制代码
该函数用于形态学滤波,其参数在代码中都列出来了的。

  • def dilate(src: Any,
      
  •            kernel: Any,
      
  •            dst: Any = None,
      
  •            anchor: Any = None,
      
  •            iterations: Any = None,
      
  •            borderType: Any = None,
      
  •            borderValue: Any = None) -> None
      


复制代码
该函数用于图像的膨胀操作,通过相邻像素范围内的局部极大运算来膨胀一张图片,从参数src输入,dst输出,其中第二个参数就是前面的核。

  • def distanceTransform(src: Any,
      
  •                       distanceType: Any,
      
  •                       maskSize: Any,
      
  •                       dst: Any = None,
      
  •                       dstType: Any = None) -> None
      


复制代码
上面函数是二值化函数,用于对图像的二值化操作,这是个常用函数。图像二值化是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。

  • def subtract(src1: Any,
      
  •              src2: Any,
      
  •              dst: Any = None,
      
  •              mask: Any = None,
      
  •              dtype: Any = None) -> None
      


复制代码
该函数为图像相减操作,是将二值化的图像使用相应位置的像素进行相减操作。

  • def watershed(image: Any,
      
  •               markers: Any) -> None
      


复制代码
该函数是分水岭的基本函数,算法使用效果主要就是该函数完成,其参数在代码的注释中已经标注出来了。
其效果如下图所示,在圆形的边界位置,已经用细小的红线在绘制出识别区域。

1.jpg (70.92 KB, 下载次数: 0)

下载附件  保存到相册  

19 分钟前 上传



源代码如下



  • # -*- coding: utf-8 -*-
      

  •   
  • import cv2
      
  • import numpy as np
      

  •   
  • camera = cv2.VideoCapture(0)
      

  •   
  • # 判断视频是否打开
      
  • if (camera.isOpened()):
      
  •     print(\“Open\“)
      
  • else:
      
  •     print(\“摄像头未打开\“)
      

  •   
  • # 测试用,查看视频size
      
  • size = (int(camera.get(cv2.CAP_PROP_FRAME_WIDTH)),
      
  •         int(camera.get(cv2.CAP_PROP_FRAME_HEIGHT)))
      
  • print(\“size:\“ + repr(size))
      

  •   

  •   
  • while True:
      
  •     # 读取视频流
      
  •     grabbed, frame_lwpCV = camera.read()
      
  •     gray_lwpCV = cv2.cvtColor(frame_lwpCV, cv2.COLOR_BGR2GRAY)
      
  •     ret, binary = cv2.threshold(gray_lwpCV, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)  # 二值化
      
  •     cv2.imshow(“binary_image“, binary)
      
  •     kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))  # 产生一个kernel
      
  •     \“\“\“
      
  •     def getStructuringElement(shape: Any,   # 形状
      
  •                           ksize: Any,       # kernel尺寸
      
  •                           anchor: Any = None) -> None
      
  •     \“\“\“
      
  •     mb = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel, iterations=2)  # 形态学操作
      
  •     \“\“\“
      
  •     def morphologyEx(src: Any,          # 原图像
      
  •                  op: Any,               # 操作类型
      
  •                                         # MORPH_ERODE    = 0, //腐蚀
      
  •                                         # MORPH_DILATE   = 1, //膨胀
      
  •                                         # MORPH_OPEN     = 2, //开操作
      
  •                                         # MORPH_CLOSE    = 3, //闭操作
      
  •                                         # MORPH_GRADIENT = 4, //梯度操作
      
  •                                         # MORPH_TOPHAT   = 5, //顶帽操作
      
  •                                         # MORPH_BLACKHAT = 6, //黑帽操作
      
  •                                         # MORPH_HITMISS  = 7  
      
  •                  kernel: Any,           # 用于膨胀操作的结构元素,kernel
      
  •                  dst: Any = None,
      
  •                  anchor: Any = None,    # 参考点
      
  •                  iterations: Any = None,
      
  •                  borderType: Any = None,
      
  •                  borderValue: Any = None) -> None
      
  •     MORPH_OPEN(开),内部就是进行了先腐蚀后膨胀的操作。
      
  •     MORPH_CLOSE(闭),其实内部就是进行了先膨胀后腐蚀的操作。
      
  •     MORPH_GRADIENT(梯度),内部是膨胀减去腐蚀。
      
  •     \“\“\“
      
  •     sure_bg = cv2.dilate(mb, kernel, iterations=3)  # 对输入图像用特定结构元素进行膨胀操作
      
  •     \“\“\“
      
  •     def dilate(src: Any,
      
  •            kernel: Any,
      
  •            dst: Any = None,
      
  •            anchor: Any = None,
      
  •            iterations: Any = None,
      
  •            borderType: Any = None,
      
  •            borderValue: Any = None) -> None
      
  •     \“\“\“
      
  •     cv2.imshow(“mor_opt“, sure_bg)
      

  •   
  •     # 距离变换
      
  •     dist = cv2.distanceTransform(mb, cv2.DIST_L2, 3)  # 距离变换
      
  •     \“\“\“
      
  •     def distanceTransform(src: Any,         # 二值化图像
      
  •                       distanceType: Any,    # 计算距离的类型,CV_DIST_L1、CV_DIST_L2 、CV_DIST_C
      
  •                       maskSize: Any,        # 距离变换掩码矩阵的大小
      
  •                       dst: Any = None,
      
  •                       dstType: Any = None) -> None
      
  •     \“\“\“
      
  •     dist_output = cv2.normalize(dist, 0, 1.0, cv2.NORM_MINMAX)
      
  •     cv2.imshow(“distance_t“, dist_output * 50)
      
  •     ret, suRFace = cv2.threshold(dist, dist.max() * 0.6, 255, cv2.THRESH_BINARY)
      
  •     cv2.imshow(“surface_bin“, surface)
      
  •     surface_fg = np.uint8(surface)
      
  •     unknown = cv2.subtract(sure_bg, surface_fg)  # 图像的相减操作
      
  •     \“\“\“
      
  •     def subtract(src1: Any,
      
  •              src2: Any,
      
  •              dst: Any = None,
      
  •              mask: Any = None,  # 可选操作掩码; 这是一个8位单通道数组,用于指定要更改的输出数组的元素。
      
  •              dtype: Any = None) -> None # 输出阵列的可选深度
      
  •     \“\“\“
      
  •     ret, markers = cv2.connectedComponents(surface_fg)  # 连通域标识
      
  •     \“\“\“
      
  •     def connectedComponents(image: Any,             # image是threshold得到的二值图
      
  •                         labels: Any = None,
      
  •                         connectivity: Any = None,
      
  •                         ltype: Any = None) -> None
      
  •     \“\“\“
      
  •     print(ret)
      

  •   
  •     # 分水岭
      
  •     markers = markers + 1
      
  •     markers[unknown == 255] = 0
      
  •     markers = cv2.watershed(frame_lwpCV, markers=markers)
      
  •     \“\“\“
      
  •     def watershed(image: Any,
      
  •               markers: Any) -> None
      
  •     第二个入参markers必须包含了种子点信息。
      
  •     在执行分水岭函数watershed之前,必须对第二个参数markers进行处理,它应该包含不同区域的轮廓,
      
  •     每个轮廓有一个自己唯一的编号,轮廓的定位可以通过Opencv中findContours方法实现,这个是执行
      
  •     分水岭之前的要求。接下来执行分水岭会发生什么呢?算法会根据markers传入的轮廓作为种子(也就是
      
  •     所谓的注水点),对图像上其他的像素点根据分水岭算法规则进行判断,并对每个像素点的区域归属进行划
      
  •     定,直到处理完图像上所有像素点。而区域与区域之间的分界处的值被置为“-1”,以做区分。
      
  •     \“\“\“
      
  •     frame_lwpCV[markers == -1] = [0, 0, 255]
      
  •     cv2.imshow(“result_image“, frame_lwpCV)
      

  •   
  •     key = cv2.waitKey(1) & 0xFF
      
  •     # 按\“q\“健退出循环
      
  •     if key == ord(\“q\“):
      
  •         break
      

  •   
  • # When everything done, release the capture
      
  • camera.release()
      
  • cv2.destroyAllWindows()

复制代码
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表