关于weka这个人我有个问题:
Hi all:
在这件事上我觉得很奇怪。
我已经准备了一个CSV文件,其中有很多缺失的值。该文件中缺少的一个值是基本值--在逗号对(即random_value1、random_value2 )之间没有任何值。这是格式的一个例子。您可以看到有一对逗号,它们之间没有什么,甚至不是一个white_space,它应该表示缺少数据的值。
奇怪的是,当我将CSV读入WEKA时,WEKA将所有缺失的值分配给问号,即'?‘。这正是WEKA表达它的方式。
然后,当我进行测试分析时,WEKA开始研究这些“?”作为某种有用的信息。它只是缺少值,能不能请韦卡跳过它?
这些问题变得非常浪费。分析结果看上去像是如果缺失了就会重视缺失,缺失就意味着缺失,缺失与缺失相关。
WEKA可以将缺失的值读取为缺失的值,而不是某种问号吗?或者我能告诉WEKA说“?”,把它们当作缺失的值吗?
谢谢各位
他用这个解决办法解决了他的问题:
我找到一种方法告诉韦卡失踪的事。只需使用ASCII编辑器的fine_and_replace函数,就可以替换所有的“?”去?
但是我不知道如何下载ASCII编辑器并使用它,有人能告诉我吗?
发布于 2012-03-23 06:43:56
我建议您在windows中使用notepad2或notepad++。
发布于 2012-03-30 02:58:44
你不需要处理丢失的值。不同的算法对缺失值的工作方式不同。所以,别担心,事情会按原来的方式处理的。
https://stackoverflow.com/questions/9826528
复制相似问题