dask_expr.to_json
dask_expr.to_json¶
- dask_expr.to_json(df, url_path, orient='records', lines=None, storage_options=None, compute=True, encoding='utf-8', errors='strict', compression=None, compute_kwargs=None, name_function=None, **kwargs)[源代码]¶
将数据框写入 JSON 文本文件
这使用了
pandas.DataFrame.to_json()
,并且大多数参数都是透传的 - 请参阅其文档字符串。区别:orient 默认是 ‘records’,并且 lines=True;这会产生在大数据应用中最常见的 JSON 输出格式,并且可以在读取时进行分块(参见
read_json()
)。- 参数
- df: dask.DataFrame
要保存的数据
- url_path: str, list of str
写入位置。如果是字符串,并且 df 中有多个分区,应包含一个通配符以扩展为一组文件名,或提供一个
name_function=
参数。支持协议规范,如"s3://"
。- 编码, 错误:
要实现的文本编码,例如“utf-8”,以及如何在转换中处理错误(参见
str.encode()
)。- orient, lines, kwargs
传递给 pandas;如果未指定,当 orient=’records’ 时,lines=True,否则为 False。
- storage_options: dict
传递给后端文件系统实现
- compute: bool
如果为真,立即执行。如果为假,返回一组延迟对象,这些对象可以在以后计算。
- compute_kwargsdict, 可选
传递给计算方法的选项
- 压缩字符串或无
类似 ‘gzip’ 或 ‘xz’ 的字符串。
- name_function可调用对象,默认为 None
接受一个整数(分区索引)并生成一个字符串以替换给定文件名全局字符串中的星号。应保持分区的字典顺序。