3 回答
TA贡献1844条经验 获得超8个赞
首先:该函数minMaxLoc
仅查找给定输入的全局最小值和全局最大值,因此对于确定区域最小值和/或区域最大值而言,它几乎没有用。但是您的想法是正确的,完全基于区域最小值/最大值提取标记以执行基于标记的分水岭变换。让我尝试阐明什么是分水岭变换,以及如何正确使用OpenCV中存在的实现。
一些处理分水岭的论文对其描述与随后的描述类似(如果不确定,我可能会漏掉一些细节:询问)。考虑一下您所知道的某个区域的表面,其中包含山谷和山峰(在这里,与我们无关的其他细节)。假设在此表面之下仅是水,有色水。现在,在表面的每个谷上打孔,然后水开始充满整个区域。在某个时候,会遇到不同颜色的水,当这种情况发生时,您要建造一个大坝,使它们彼此不接触。最后,您将获得水坝的集合,这是分隔所有不同颜色的水的分水岭。
现在,如果您在该表面上钻孔太多,则最终会出现太多区域:过度分割。如果您做得太少,您将获得细分市场。因此,几乎所有建议使用分水岭的论文实际上都提出了避免这些问题的技术,以解决论文正在处理的应用程序。
我写了所有这些内容(对于任何了解分水岭变换的人来说都太幼稚了),因为它直接反映了您应该如何使用分水岭实现(当前公认的答案是完全错误的方式)。现在让我们使用Python绑定从OpenCV示例开始。
问题中显示的图像由许多物体组成,这些物体太近且在某些情况下重叠。分水岭在这里的用途是正确地将这些对象分开,而不是将它们分组为单个组件。因此,每个对象至少需要一个标记,背景至少需要一个良好的标记。例如,首先通过Otsu对输入图像进行二值化,然后执行形态学打开操作以去除小物体。该步骤的结果如下左图所示。现在,对于二进制图像,请考虑对其应用距离变换,结果如右图所示。
根据距离变换结果,我们可以考虑一些阈值,以便仅考虑距背景最远的区域(下图为左图)。这样做,通过在较早的阈值之后标记不同的区域,我们可以获得每个对象的标记。现在,我们还可以考虑将左侧图片的放大版本的边框组成标记。完整的标记显示在右侧的下方(某些标记太暗而看不见,但左侧图像中的每个白色区域均在右侧图像中表示)。
我们在这里使用的这个标记很有意义。每个colored water == one marker
将开始填充该区域,并且分水岭转换将建造水坝,以阻止不同的“颜色”合并。如果进行变换,则图像在左侧。通过将水坝与原始图像进行组合而仅考虑水坝,我们得到的结果是正确的。
import sys
import cv2
import numpy
from scipy.ndimage import label
def segment_on_dt(a, img):
border = cv2.dilate(img, None, iterations=5)
border = border - cv2.erode(border, None)
dt = cv2.distanceTransform(img, 2, 3)
dt = ((dt - dt.min()) / (dt.max() - dt.min()) * 255).astype(numpy.uint8)
_, dt = cv2.threshold(dt, 180, 255, cv2.THRESH_BINARY)
lbl, ncc = label(dt)
lbl = lbl * (255 / (ncc + 1))
# Completing the markers now.
lbl[border == 255] = 255
lbl = lbl.astype(numpy.int32)
cv2.watershed(a, lbl)
lbl[lbl == -1] = 0
lbl = lbl.astype(numpy.uint8)
return 255 - lbl
img = cv2.imread(sys.argv[1])
# Pre-processing.
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
_, img_bin = cv2.threshold(img_gray, 0, 255,
cv2.THRESH_OTSU)
img_bin = cv2.morphologyEx(img_bin, cv2.MORPH_OPEN,
numpy.ones((3, 3), dtype=int))
result = segment_on_dt(img, img_bin)
cv2.imwrite(sys.argv[2], result)
result[result != 255] = 0
result = cv2.dilate(result, None)
img[result == 255] = (0, 0, 255)
cv2.imwrite(sys.argv[3], img)
添加回答
举报