dask_expr.to_json

dask_expr.to_json¶

dask_expr.to_json(df, url_path, orient='records', lines=None, storage_options=None, compute=True, encoding='utf-8', errors='strict', compression=None, compute_kwargs=None, name_function=None, **kwargs)[源代码]¶

将数据框写入 JSON 文本文件

这使用了 pandas.DataFrame.to_json()，并且大多数参数都是透传的 - 请参阅其文档字符串。

区别：orient 默认是 ‘records’，并且 lines=True；这会产生在大数据应用中最常见的 JSON 输出格式，并且可以在读取时进行分块（参见 read_json()）。

参数

df: dask.DataFrame: 要保存的数据
url_path: str, list of str: 写入位置。如果是字符串，并且 df 中有多个分区，应包含一个通配符以扩展为一组文件名，或提供一个 name_function= 参数。支持协议规范，如 "s3://"。
编码, 错误:: 要实现的文本编码，例如“utf-8”，以及如何在转换中处理错误（参见 str.encode()）。
orient, lines, kwargs: 传递给 pandas；如果未指定，当 orient=’records’ 时，lines=True，否则为 False。
storage_options: dict: 传递给后端文件系统实现
compute: bool: 如果为真，立即执行。如果为假，返回一组延迟对象，这些对象可以在以后计算。
compute_kwargsdict, 可选: 传递给计算方法的选项
压缩字符串或无: 类似 ‘gzip’ 或 ‘xz’ 的字符串。
name_function可调用对象，默认为 None: 接受一个整数（分区索引）并生成一个字符串以替换给定文件名全局字符串中的星号。应保持分区的字典顺序。

dask_expr.to_sql

dask_expr.DataFrame.to_bag