dask_expr.to_json

dask_expr.to_json

dask_expr.to_json(df, url_path, orient='records', lines=None, storage_options=None, compute=True, encoding='utf-8', errors='strict', compression=None, compute_kwargs=None, name_function=None, **kwargs)[源代码]

将数据框写入 JSON 文本文件

这使用了 pandas.DataFrame.to_json(),并且大多数参数都是透传的 - 请参阅其文档字符串。

区别:orient 默认是 ‘records’,并且 lines=True;这会产生在大数据应用中最常见的 JSON 输出格式,并且可以在读取时进行分块(参见 read_json())。

参数
df: dask.DataFrame

要保存的数据

url_path: str, list of str

写入位置。如果是字符串,并且 df 中有多个分区,应包含一个通配符以扩展为一组文件名,或提供一个 name_function= 参数。支持协议规范,如 "s3://"

编码, 错误:

要实现的文本编码,例如“utf-8”,以及如何在转换中处理错误(参见 str.encode())。

orient, lines, kwargs

传递给 pandas;如果未指定,当 orient=’records’ 时,lines=True,否则为 False。

storage_options: dict

传递给后端文件系统实现

compute: bool

如果为真,立即执行。如果为假,返回一组延迟对象,这些对象可以在以后计算。

compute_kwargsdict, 可选

传递给计算方法的选项

压缩字符串或无

类似 ‘gzip’ 或 ‘xz’ 的字符串。

name_function可调用对象,默认为 None

接受一个整数(分区索引)并生成一个字符串以替换给定文件名全局字符串中的星号。应保持分区的字典顺序。