我想在ALS模型中计算RMSE,我发现如下代码:
val ratings = data.map(_.split(',') match {
case Array(user,item,rate)
=>
Rating(user.toLong,item.toInt,rate.toFloat)
})
val ratingsDF= ratings.toDF
val model = new ALS().setRank(3).setMaxIter(10).fit(ratingsDF)
val predictions = model.transform(ratingsDF)
val evaluator = new RegressionEvaluator().setMetricName("rmse").setLabelCol("rating").setPredictionCol("prediction")
val rmse = evaluator.evaluate(predictions)
System.out.println("Root-mean-square error = " + rose)然而,我得到了"NaN“。我想知道我使用的方法是错误的还是数据本身的问题。如果代码出错,那么计算RMSE的正确方法是什么?我只找到这样的方法:
var predictions = model.predict(usersProducts).map { case Rating(user, product, rate) => ((user, product), rate) }
val ratesAndPreds = ratings.map { case Rating(user, product, rate) => ((user, product), rate) }.join(predictions)
val rmse= math.sqrt(ratesAndPreds.map { case ((user, product), (r1, r2)) => val err = (r1 - r2) err * err }.mean())println(s"RMSE = $rmse")这里不能用这个。该怎么做呢?
发布于 2016-10-03 15:52:12
这似乎是一个缺陷。有关更多信息,请看一下这个火花JIRA:https://issues.apache.org/jira/browse/SPARK-14489
当构建包含ALS估计器的Spark管道时,度量"rmse“、"mse”、"r2“和"mae”都返回NaN。
https://stackoverflow.com/questions/38237218
复制相似问题