dask_expr.from_delayed
dask_expr.from_delayed¶
- dask_expr.from_delayed(dfs: Delayed | distributed.Future | Iterable[Delayed | distributed.Future], meta=None, divisions: tuple | None = None, prefix: str | None = None, verify_meta: bool = True)[源代码]¶
从许多 Dask Delayed 对象创建 Dask DataFrame
警告
from_delayed
仅应在创建数据的物体复杂且无法以令人尴尬的并行方式轻松表示为单个函数时使用。如果查询可以表示为一个单一函数,推荐使用
from_map
,例如:- def read_xml(path):
return pd.read_xml(path)
ddf = dd.from_map(read_xml, paths)
from_delayed
未来可能会被弃用。- 参数
- dfs
一个
dask.delayed.Delayed
,一个distributed.Future
,或这些对象的迭代,例如由client.submit
返回。这些构成了结果数据帧的各个分区。如果提供了一个单一对象(不是迭代),那么结果数据帧将只有一个分区。- $META
- 部门
沿索引的分区边界。对于元组,请参见 http://www.aidoczh.com/dask/dataframe-design.html#partitions 。如果为 None,则不会使用索引信息。
- 前缀
要添加到键前面的前缀。
- verify_meta
如果为 True,检查分区是否具有一致的元数据,默认为 True。