文章/答案/技术大牛

发布

社区首页 >问答首页 >如何在pyspark dataframe中将时间戳转换为bigint

问如何在pyspark dataframe中将时间戳转换为bigint
EN

Stack Overflow用户

提问于 2019-09-15 22:42:18

回答 2查看 1.8K关注 0票数 1

我在spark环境中使用python，想要将dataframe coulmn从时间戳数据类型转换为bigint (UNIX时间戳)。列如下所示：("yyyy-MM-dd hh:mm:ss.SSSSSS")

timestamp_col               
2014-06-04 10:09:13.334422      
2015-06-03 10:09:13.443322      
2015-08-03 10:09:13.232431

我读了一遍，并尝试了其他方法：

from pyspark.sql.functions import from_unixtime, unix_timestamp
from pyspark.sql.types import TimestampType

df1 = df.select((from_unixtime(unix_timestamp(df.timestamp_col, "yyyy-MM-dd hh:mm:ss.SSSSSS"))).cast(TimestampType()).alias("unix_time_col"))

但是输出给出的值相当于空值。

+-------------+
|unix_time_col|
+-------------+
|         null|
|         null|
|         null|

我在hadoop环境下使用python3.7on spark & hadoop版本：google-colaboratory上的spark-2.3.1-bin-hadoop2.7，我一定是遗漏了什么。有什么可以帮忙的吗？

pyspark

apache-spark-sql

dataframe

回答 2

Stack Overflow用户

发布于 2019-09-16 15:33:52

请删除您的代码中的".SSSSSS“，然后它将在转换为unixtimestamp时工作，即代替"yyyy-MM-dd hh:mm:ss.SSSSSS”，如下：

df1 = df.select(unix_timestamp(df.timestamp_col，"yyyy-MM-dd hh:mm:ss"))

票数 1

Stack Overflow用户

发布于 2019-09-16 01:32:54

from pyspark.sql import SparkSession
from pyspark.sql.functions import unix_timestamp
from pyspark.sql.types import (DateType, StructType, StructField, StringType)

spark = SparkSession.builder.appName('abc').getOrCreate()

column_schema = StructType([StructField("timestamp_col", StringType())])
data = [['2014-06-04 10:09:13.334422'], ['2015-06-03 10:09:13.443322'], ['2015-08-03 10:09:13.232431']]

data_frame = spark.createDataFrame(data, schema=column_schema)

data_frame.withColumn("timestamp_col", data_frame['timestamp_col'].cast(DateType()))
data_frame = data_frame.withColumn('timestamp_col', unix_timestamp('timestamp_col'))
data_frame.show()

输出

+-------------+
|timestamp_col|
+-------------+
|   1401894553|
|   1433344153|
|   1438614553|
+-------------+

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57945174

复制

相似问题

问如何在pyspark dataframe中将时间戳转换为bigint
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在pyspark dataframe中将时间戳转换为bigintEN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在pyspark dataframe中将时间戳转换为bigint
EN