文章/答案/技术大牛

发布

社区首页 >问答首页 >ELKI输出指数

问ELKI输出指数
EN

Stack Overflow用户

提问于 2018-12-10 15:11:30

回答 1查看 72关注 0票数 0

我使用ELKI对CSV文件中的数据进行聚类。

我使用

-resulthandler ResultWriter
-out folder/

保存输出数据

但是作为输出，我有一些奇怪的索引

ID=2138 0.1799 0.2761
ID=2137 0.1797 0.2778
ID=2136 0.1796 0.2787
ID=2109 0.1161 0.2072
ID=2007 0.1139 0.2047

虽然我的训练样本不足100个，但身份证仍超过2000份。

output

cluster-analysis

data-mining

dbscan

elki

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-12-10 16:54:17

DBID是内部的；文档明确指出，您不应该对它们做太多的假设，因为它们的implementation 可能会 change。它们被写入输出的唯一原因是某些方法(如光学)可能需要通过这个唯一的ID交叉引用对象。

因为它们是唯一的标识符，所以它们通常是不断递增的。下一次在MiniGUI中单击"run“时，您将得到下一个n个ID.所以很明显，你点击了不止一次。

ELKI文档中的“提示和技巧”可能回答了您的基本问题--如何使用映射DBID来排行输入文件的编号。最好的方法是使用(如果您想拥有对象标识符)，通过使用标识符列(并将其配置为外部标识符)自行分配对象标识符()。

有关更多信息，请参见文档：https://elki-project.github.io/dev/dbids

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53708467

复制

相似问题

问ELKI输出指数
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问ELKI输出指数EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问ELKI输出指数
EN