我在一个图像数据集上实现了几种聚类算法。我感兴趣的是获得集群的成功率。我要检测肿瘤的面积,在原来的图像中我知道肿瘤的位置,我想比较这两幅图像并获得成功的百分比。以下图片:
原图:我知道癌症的位置

图像聚类后算法

我用的是python 2.7。
发布于 2018-07-25 18:21:27
分割精度
这是图像分割文献中非常常见的一个问题,例如这是一个StackOverflow帖子。
一种常见的方法是考虑“正确像素”与“不正确像素”的比率,这是图像分割中常见的安全域,例如面具RCNN、PixelNet。
将它更多地看作是一个对象检测任务,您可以将对象的外壳重叠起来,只测量准确性 (通常分为精确,召回、F分和其他使用各种偏置/偏斜的度量)。这允许您产生一个ROC曲线,可以校准为假阳性/假阴性。
在什么是正确的问题上没有不可知论的共识。基蒂提供两者。
掩码RCNN是开放源代码的最新技术,并在python中提供了实现。
在你的领域(医学),适用标准的统计规则。用一套遮挡装置。交叉验证。等。(*)
注:虽然文献空间大得惊人,但我要提醒你看看一些与领域相关的论文,因为它们可能比其他视觉(例如数字识别)的“统计捷径”更少。项目接受。
Python
除了上面的掩码rcnn链接之外,科学知识-学习还提供了一些用户友好的工具,并且被认为是python标准科学“堆栈”的一部分。
在python中实现图像之间的差异非常简单(使用numpy)。这是一个过火的所以链接。
python 很容易自己实现中的边界框交叉口;我会使用类似于如果您想要度量一般多边形交点,请保持良好的形状。的库。
Scikit-learning有一些很好的机器学习评估工具,例如,
文献检索
您可能在寻找答案时遇到困难的一个原因是,您试图在监督的学习领域中度量一种非监督方法聚类的性能。在数学(**)中,“集群”从根本上说是定义不足的。你想看看有监督的学习文献,以获得准确的衡量标准。
也有关于无监督学习/聚类的文献,一般都是寻找拓扑结构。下面是一个非常介绍性的总结。我不认为这是你想要的。
一个常见的问题,特别是在规模,是监督的方法需要标签,这可以是准确生产所需时间的密集分割。目标检测让事情变得更容易一些。
有一些现有的医学数据集([1],[2],例如)和一些正在进行的无标签度量的研究。如果这些选项都不是您的选择,那么您可能不得不恢复到认为它是一个无监督的问题,但评估变得非常不同的范围和效用。
脚注
*人们有时跳过交叉验证,即使他们不应该,主要是因为模型是缓慢的适应,他们是一群懒惰的人。请不要跳过https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set,否则你的结果可能是危险的无用
**你可以找到各种各样的“正式”定义,但从来没有两个人同意哪种定义是正确的或最有用的。这是比较密集的读数
https://stackoverflow.com/questions/51525036
复制相似问题