dask_expr.from_delayed

dask_expr.from_delayed

dask_expr.from_delayed(dfs: Delayed | distributed.Future | Iterable[Delayed | distributed.Future], meta=None, divisions: tuple | None = None, prefix: str | None = None, verify_meta: bool = True)[源代码]

从许多 Dask Delayed 对象创建 Dask DataFrame

警告

from_delayed 仅应在创建数据的物体复杂且无法以令人尴尬的并行方式轻松表示为单个函数时使用。

如果查询可以表示为一个单一函数,推荐使用 from_map ,例如:

def read_xml(path):

return pd.read_xml(path)

ddf = dd.from_map(read_xml, paths)

from_delayed 未来可能会被弃用。

参数
dfs

一个 dask.delayed.Delayed ,一个 distributed.Future ,或这些对象的迭代,例如由 client.submit 返回。这些构成了结果数据帧的各个分区。如果提供了一个单一对象(不是迭代),那么结果数据帧将只有一个分区。

$META
部门

沿索引的分区边界。对于元组,请参见 http://www.aidoczh.com/dask/dataframe-design.html#partitions 。如果为 None,则不会使用索引信息。

前缀

要添加到键前面的前缀。

verify_meta

如果为 True,检查分区是否具有一致的元数据,默认为 True。