dask_expr._collection.DataFrame.compute
dask_expr._collection.DataFrame.compute¶
- DataFrame.compute(fuse=True, concatenate=True, **kwargs)¶
计算这个 DataFrame。
这将一个懒惰的 Dask DataFrame 转换为内存中的 pandas DataFrame。在调用此操作之前,整个数据集必须适合内存。
优化器在触发计算之前对 DataFrame 进行处理。优化器注入了一个重分区操作,将分区数减少到 1,以启用更好的优化策略。
- 参数
- fusebool, 默认 True
是否在计算前融合表达式树。融合显著减少了任务数量并提高了性能。除非绝对必要,否则不应禁用。
- 连接bool, 默认 True
是否在计算之前将所有分区连接成一个单一的分区。连接可以启用更强大的优化,但它也会产生额外的数据传输成本。通常,应该启用此功能。
- kwargs
传递给基础计算函数的额外关键字参数。
参见