我刚开始使用Orange工具进行数据挖掘。我有一个包含数据的csv文件,它是离散值和连续值的混合。然而,它认为一些离散的值是'String‘。
我在这里做错了什么吗?还是有其他的问题?在这两种情况下,我都想知道如何将这个“String”值转换为离散的。
有关数据的信息:文件最初有4个离散值类别,包含10-15个值(例如技术、媒体)、topcat包含100多个值(时装、艺术)、位置包含200多个值(例如纽约、波士顿)、货币包含5-10个值(美元、英镑)。
Orange认为topcat和位置特征是字符串。
发布于 2015-08-23 21:51:57
我认为您可以强制Orange按照指定的类型来解释变量,例如,要使某一列成为一个离散变量,您必须设置该列的标题以包含D# (按照文献资料)。
https://stackoverflow.com/questions/32158327
复制相似问题