首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从PySpark中的两个不同数据帧中减去列的值,得到均方根

从PySpark中的两个不同数据帧中减去列的值,得到均方根
EN

Stack Overflow用户
提问于 2018-02-27 21:52:40
回答 2查看 8.8K关注 0票数 3

我想不出来。我正在尝试计算测试数据和预测数据之间的RMSE。

测试

代码语言:javascript
复制
col1    col2
 a        2 
 b        3

预测

代码语言:javascript
复制
col1   col2
 a       4 
 b       5

我正在尝试做这个测试(Col2)-prediction(Col2)。那是

代码语言:javascript
复制
2-4 =-2
3-5 =-2

我试过了

代码语言:javascript
复制
test.select("col2").subtract(prediction.select("col2"))

但我没有得到所需的结果。我正在尝试获得此结果以查找RMSE。spark中是否有一个内置函数来查找RMSE?

谢谢。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-02-27 22:00:04

它是一个连接和一个算术减法:

代码语言:javascript
复制
test.join(prediction, on="col1").withColumn("sub", test.col2-prediction.col2)
票数 4
EN

Stack Overflow用户

发布于 2018-08-07 15:25:22

请在下面的表达式中替换您的表名:

代码语言:javascript
复制
tab1.join(tab2).withColumn("Sub", tab2("T1")-tab1("T")).select("Sub").show() 
票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49010335

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档