首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在json文件上将字符串转换为numerical - PySpark操作

在json文件上将字符串转换为numerical - PySpark操作
EN

Stack Overflow用户
提问于 2017-01-14 11:40:52
回答 1查看 621关注 0票数 0

我遇到了一个将“字符串”列转换为数字的问题。

我能够执行以下两个命令:

代码语言:javascript
复制
people=sqlContext.read.json("C:\wdchentxt\People2.json")
people.select('name',people.age+1).show()

但我得到了以下错误,因为'age‘是“不是数字列”。如何将age列从字符串收敛到数值型?

代码语言:javascript
复制
people.groupBy('gender').sum('age').show()

我特别困惑,因为people.age+1是成功的。

EN

回答 1

Stack Overflow用户

发布于 2017-01-14 14:23:10

您可以在PySpark数据帧中使用cast函数

代码语言:javascript
复制
df.select('gender',df.age.cast('int').alias('age')).groupBy('gender').sum('age').show()
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41646578

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档