文章/答案/技术大牛

发布

社区首页 >问答首页 >如何找到聚类算法的成功率？

问如何找到聚类算法的成功率？
EN

Stack Overflow用户

提问于 2018-07-25 17:56:05

回答 1查看 654关注 0票数 13

我在一个图像数据集上实现了几种聚类算法。我感兴趣的是获得集群的成功率。我要检测肿瘤的面积，在原来的图像中我知道肿瘤的位置，我想比较这两幅图像并获得成功的百分比。以下图片：

原图:我知道癌症的位置

图像聚类后算法

我用的是python 2.7。

python

image-processing

cluster-analysis

analysis

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-07-25 18:21:27

分割精度

这是图像分割文献中非常常见的一个问题，例如这是一个StackOverflow帖子。

一种常见的方法是考虑“正确像素”与“不正确像素”的比率，这是图像分割中常见的安全域，例如面具RCNN、PixelNet。

将它更多地看作是一个对象检测任务，您可以将对象的外壳重叠起来，只测量准确性 (通常分为精确，召回、F分和其他使用各种偏置/偏斜的度量)。这允许您产生一个ROC曲线，可以校准为假阳性/假阴性。

在什么是正确的问题上没有不可知论的共识。基蒂提供两者。

掩码RCNN是开放源代码的最新技术，并在python中提供了实现。

在你的领域(医学)，适用标准的统计规则。用一套遮挡装置。交叉验证。等。(*)

注:虽然文献空间大得惊人，但我要提醒你看看一些与领域相关的论文，因为它们可能比其他视觉(例如数字识别)的“统计捷径”更少。项目接受。

"三维医学图像分割的评价指标:分析、选择和工具“在您的域中提供了一些总结方法。
"当前图像分割的几种方法“大约有2500个引文，但稍早一些。
"基于模式识别的MR图像分割技术综述“更老了一点，它会让你安全地进入”传统“视觉模型。
脑肿瘤MR图像的自动分割主要是关于它的分段验证过程。

Python

除了上面的掩码rcnn链接之外，科学知识-学习还提供了一些用户友好的工具，并且被认为是python标准科学“堆栈”的一部分。

在python中实现图像之间的差异非常简单(使用numpy)。这是一个过火的所以链接。

python 很容易自己实现中的边界框交叉口；我会使用类似于如果您想要度量一般多边形交点，请保持良好的形状。的库。

Scikit-learning有一些很好的机器学习评估工具，例如，

ROC曲线
交叉验证
模型选择
一百万其他人

文献检索

您可能在寻找答案时遇到困难的一个原因是，您试图在监督的学习领域中度量一种非监督方法聚类的性能。在数学(**)中，“集群”从根本上说是定义不足的。你想看看有监督的学习文献，以获得准确的衡量标准。

也有关于无监督学习/聚类的文献，一般都是寻找拓扑结构。下面是一个非常介绍性的总结。我不认为这是你想要的。

一个常见的问题，特别是在规模，是监督的方法需要标签，这可以是准确生产所需时间的密集分割。目标检测让事情变得更容易一些。

有一些现有的医学数据集([1]，[2]，例如)和一些正在进行的无标签度量的研究。如果这些选项都不是您的选择，那么您可能不得不恢复到认为它是一个无监督的问题，但评估变得非常不同的范围和效用。

脚注

*人们有时跳过交叉验证，即使他们不应该，主要是因为模型是缓慢的适应，他们是一群懒惰的人。请不要跳过https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set，否则你的结果可能是危险的无用

**你可以找到各种各样的“正式”定义，但从来没有两个人同意哪种定义是正确的或最有用的。这是比较密集的读数

票数 10

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51525036

复制

相似问题

问如何找到聚类算法的成功率？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何找到聚类算法的成功率？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何找到聚类算法的成功率？
EN