pyspark.sql.DataFrame.toJSON

DataFrame. toJSON ( use_unicode : bool = True ) → pyspark.rdd.RDD [ str ] [source]

将一个 DataFrame 转换为一个 RDD 的字符串。

每一行被转换为一个JSON文档,作为返回的RDD中的一个元素。

在版本 1.3.0 中新增。

Parameters
use_unicode bool, optional, default True

是否转换为unicode。

Returns
RDD

示例

>>> df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
>>> df.toJSON().first()
'{"age":2,"name":"Alice"}'