首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用Spark Scala从GeneralizedLinearRegressionModel计算pValue

如何使用Spark Scala从GeneralizedLinearRegressionModel计算pValue
EN

Stack Overflow用户
提问于 2018-12-28 22:59:14
回答 1查看 707关注 0票数 1

我正在尝试使用GeneralizedLinearRegression计算pValue,并得到以下异常。

代码语言:javascript
复制
    val assembler = new VectorAssembler()
      .setInputCols(final_columns)
      .setOutputCol("Feature")

val glr = new GeneralizedLinearRegression()
      .setFamily("binomial")
      .setLink("logit")
      .setMaxIter(1)
      .setRegParam(0.0)
      .setFeaturesCol("Feature")
      .setLabelCol("LM_2")
      //.setSolver("auto")

    val pipeline = new Pipeline().setStages(Array(assembler,glr))
    val lrModel_general = pipeline.fit(indexedDF)
    val sum = lrModel_general.stages.last.asInstanceOf[GeneralizedLinearRegressionModel].summary.pValues

Exception in thread "main" java.lang.UnsupportedOperationException: No p-value available for this GeneralizedLinearRegressionModel
at org.apache.spark.ml.regression.GeneralizedLinearRegressionTrainingSummary.pValues$lzycompute(GeneralizedLinearRegression.scala:1480)
at org.apache.spark.ml.regression.GeneralizedLinearRegressionTrainingSummary.pValues(GeneralizedLinearRegression.scala:1468)
at com.cvs.scala.ml.model.LR_SqlDB_LocalMessageGrouping$.main(LR_SqlDB_LocalMessageGrouping.scala:172)
at com.cvs.scala.ml.model.LR_SqlDB_LocalMessageGrouping.main(LR_SqlDB_LocalMessageGrouping.scala)
EN

回答 1

Stack Overflow用户

发布于 2018-12-31 15:56:01

首先,这肯定是关于统计的,所以请考虑阅读this answer

至于你在Spark中的解决方案,我建议检查模型的类,避免给出Ridge模型的摘要,因为它对这种模型几乎是无用的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53960420

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档