pyspark.sql.functions.parse_url

pyspark.sql.functions. parse_url ( url : ColumnOrName , partToExtract : ColumnOrName , key : Optional [ ColumnOrName ] = None ) → pyspark.sql.column.Column [source]

从URL中提取一部分。

新增于版本 3.5.0。

Parameters
url Column or str

一列字符串。

partToExtract Column or str

一列字符串,路径。

key Column or str, optional

一列字符串,键。

示例

>>> df = spark.createDataFrame(
...     [("http://spark.apache.org/path?query=1", "QUERY", "query",)],
...     ["a", "b", "c"]
... )
>>> df.select(parse_url(df.a, df.b, df.c).alias('r')).collect()
[Row(r='1')]
>>> df.select(parse_url(df.a, df.b).alias('r')).collect()
[Row(r='query=1')]