如何将文本数据转换为LibSVM文件格式,以训练垃圾邮件分类模型。SVMFiles已经被标记了吗?
发布于 2018-01-06 00:44:28
支持向量机格式既不是必需的,也不是有用的。它在Apache示例中使用,只是因为它可以直接映射到所需的格式。
SVMFiles已经被标记了吗?
不一定,但火花只能读取标签变体。
实际上,您应该使用org.apache.spark.ml.feature工具从数据中提取相关特性。
您可以跟踪文献资料以及关于此的许多问题。
https://stackoverflow.com/questions/48121745
复制相似问题