我试图使用shogun工具箱来将此数据集中的人归类为溺水或不溺水。
我想用CFIle,LibSVMFile,SparseRealFeatures等.正如幕府游戏攻略中提到的,但我被塞了下来。
首先,在本介绍中,您直接以这种格式加载a LibSVMFile,但是,作者没有提到它们是如何从CSV格式(它是他使用的数据集的原始格式)生成数据文件的.
由于我没有所需格式的数据集,所以我尝试用CFile类加载数据集,或者更好地用CCSVFile类加载数据集,但我得到了
NameError: name 'CFile' is not defined和
NameError: name 'CCSVFile' is not defined(我使用的是通过Python3编译自Ubuntu17.10的源代码的shogun,并使用"from shogun import *“导入所有shogun。)
不过,当我用
data_file=LibSVMFile(os.path.join(SHOGUN_DATA_DIR, 'train.csv'))如本例所示,没有关于非定义类的错误,但正如预期的那样,它会在以下文件中退化:
[1] 8870 segmentation fault (core dumped) python3 titanic.py我想知道用这个shogun引擎加载数据集的正确方法是什么.
在其他shogun笔记本中,他们没有使用它们,只是使用其他库加载数据集,我开始认为这是最好的方法。
发布于 2018-02-14 10:33:13
要读取CSV文件,您应该运行以下代码(在python中):
import shogun as sg
train_csv = sg.CSV("train.csv")但是请注意,该文件包含了许多需要编码的分类,所以首先您应该在尝试在shogun模型中使用它之前进行一些数据处理。
https://stackoverflow.com/questions/48609625
复制相似问题