我正在从事一些项目,需要训练我的模型使用数据文件。问题是用于模型训练的数据文件的大小是10G。因此,我不能一次导入数据。另一种方法是修剪数据,只使用5%的训练数据。但我可能会泄露一些信息。我的问题是“是否可以通过将文件拆分成多个文件来训练模型?”
发布于 2014-11-09 01:47:43
可以使用Update Model运算符用新的示例集数据更新以前创建的模型。并不是所有的模型运算符都可以这样使用,朴素贝叶斯和k-NN确实可以像Weka的W-IBk一样工作。
可以在RapidMiner中创建一个流程,将文件拆分成较小的部分,逐个读取它们,并根据这些文件创建一个模型。
https://stackoverflow.com/questions/26815021
复制相似问题