首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何找到聚类算法的成功率?

如何找到聚类算法的成功率?
EN

Stack Overflow用户
提问于 2018-07-25 17:56:05
回答 1查看 654关注 0票数 13

我在一个图像数据集上实现了几种聚类算法。我感兴趣的是获得集群的成功率。我要检测肿瘤的面积,在原来的图像中我知道肿瘤的位置,我想比较这两幅图像并获得成功的百分比。以下图片:

原图:我知道癌症的位置

图像聚类后算法

我用的是python 2.7。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-07-25 18:21:27

分割精度

这是图像分割文献中非常常见的一个问题,例如这是一个StackOverflow帖子

一种常见的方法是考虑“正确像素”与“不正确像素”的比率,这是图像分割中常见的安全域,例如面具RCNNPixelNet

将它更多地看作是一个对象检测任务,您可以将对象的外壳重叠起来,只测量准确性 (通常分为精确,召回F分和其他使用各种偏置/偏斜的度量)。这允许您产生一个ROC曲线,可以校准为假阳性/假阴性。

在什么是正确的问题上没有不可知论的共识。基蒂提供两者。

掩码RCNN是开放源代码的最新技术,并在python中提供了实现。

在你的领域(医学),适用标准的统计规则。用一套遮挡装置。交叉验证。等。(*)

注:虽然文献空间大得惊人,但我要提醒你看看一些与领域相关的论文,因为它们可能比其他视觉(例如数字识别)的“统计捷径”更少。项目接受。

Python

除了上面的掩码rcnn链接之外,科学知识-学习还提供了一些用户友好的工具,并且被认为是python标准科学“堆栈”的一部分。

在python中实现图像之间的差异非常简单(使用numpy)。这是一个过火的所以链接

python 很容易自己实现中的边界框交叉口;我会使用类似于如果您想要度量一般多边形交点,请保持良好的形状。的库。

Scikit-learning有一些很好的机器学习评估工具,例如,

  • ROC曲线
  • 交叉验证
  • 模型选择
  • 一百万其他人

文献检索

您可能在寻找答案时遇到困难的一个原因是,您试图在监督的学习领域中度量一种非监督方法聚类的性能。在数学(**)中,“集群”从根本上说是定义不足的。你想看看有监督的学习文献,以获得准确的衡量标准。

也有关于无监督学习/聚类的文献,一般都是寻找拓扑结构。下面是一个非常介绍性的总结。我不认为这是你想要的。

一个常见的问题,特别是在规模,是监督的方法需要标签,这可以是准确生产所需时间的密集分割。目标检测让事情变得更容易一些

有一些现有的医学数据集([1][2],例如)和一些正在进行的无标签度量的研究。如果这些选项都不是您的选择,那么您可能不得不恢复到认为它是一个无监督的问题,但评估变得非常不同的范围和效用。

脚注

*人们有时跳过交叉验证,即使他们不应该,主要是因为模型是缓慢的适应,他们是一群懒惰的人。请不要跳过https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set,否则你的结果可能是危险的无用

**你可以找到各种各样的“正式”定义,但从来没有两个人同意哪种定义是正确的或最有用的。这是比较密集的读数

票数 10
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51525036

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档