已解决430363个问题，去搜搜看，总会有你想问的

'Column' 对象不能用 Regex 和 Pyspark 调用

首页猿问 'Column'...

'Column' 对象不能用 Regex 和 Pyspark 调用

Python

ABOUTYOU 2022-07-05 19:48:58

我只需要从“页面 URL”列中的 url 字符串中提取整数，并将这些提取的整数附加到新列中。我正在使用 PySpark。我的代码如下：from pyspark.sql.functions import col, regexp_extractspark_df_url.withColumn("new_column", regexp_extract(col("Page URL"), "\d+", 1).show())我有以下错误： TypeError: 'Column' object is not callable。

查看完整描述

1 回答

开满天机

TA贡献1786条经验获得超13个赞

您可以使用

spark_df_url.withColumn("new_column", regexp_extract("Page URL", "\d+", 0))

将字符串列的名称指定为第一个参数，regexp_replace并确保将第三个参数设置为，0因为您的模式没有捕获组，并且您有兴趣获取整个匹配值作为结果。

请注意，当您指定1为第三个参数时，您会得到空结果：

如果正则表达式不匹配，或者指定的组不匹配，则返回一个空字符串。

反对回复 2022-07-05

1 回答
0 关注
228 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

'Column' 对象不能用 Regex 和 Pyspark 调用

'Column' 对象不能用 Regex 和 Pyspark 调用

1 回答

添加回答