为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用 pyspark 将时间戳转换为 unix 格式

如何使用 pyspark 将时间戳转换为 unix 格式

幕布斯6054654 2021-08-17 09:51:11
我有一个带有时间戳值的数据框,如下所示:2018-02-15T11:39:13.000Z 我想使用 Pyspark 以 UNIX 格式拥有它。我尝试了类似的方法,data = datasample.withColumn('timestamp_cast', datasample['timestamp'].cast('date'))但我丢失了很多信息,因为当我的源中有毫秒信息时,我只会得到日/月/年。结果: 2018-02-15任何想法获得unix格式并保持精度?谢谢!
查看完整描述

1 回答

?
叮当猫咪

TA贡献1776条经验 获得超12个赞

您可以通过unix_timestamp以下方式使用内置:


from pyspark.sql.functions import unix_timestamp

df = df.withColumn('unix', unix_timestamp('timestamp'))

要么


df = df.selectExpr('unix_timestamp(timestamp)')


查看完整回答
反对 回复 2021-08-17
  • 1 回答
  • 0 关注
  • 292 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信