我使用ELKI对CSV文件中的数据进行聚类。
我使用
-resulthandler ResultWriter
-out folder/保存输出数据
但是作为输出,我有一些奇怪的索引
ID=2138 0.1799 0.2761
ID=2137 0.1797 0.2778
ID=2136 0.1796 0.2787
ID=2109 0.1161 0.2072
ID=2007 0.1139 0.2047虽然我的训练样本不足100个,但身份证仍超过2000份。
发布于 2018-12-10 16:54:17
DBID是内部的;文档明确指出,您不应该对它们做太多的假设,因为它们的implementation 可能会 change。它们被写入输出的唯一原因是某些方法(如光学)可能需要通过这个唯一的ID交叉引用对象。
因为它们是唯一的标识符,所以它们通常是不断递增的。下一次在MiniGUI中单击"run“时,您将得到下一个n个ID.所以很明显,你点击了不止一次。
ELKI文档中的“提示和技巧”可能回答了您的基本问题--如何使用映射DBID来排行输入文件的编号。最好的方法是使用(如果您想拥有对象标识符),通过使用标识符列(并将其配置为外部标识符)自行分配对象标识符()。
有关更多信息,请参见文档:https://elki-project.github.io/dev/dbids
https://stackoverflow.com/questions/53708467
复制相似问题