dask.dataframe.compute
dask.dataframe.compute¶
- dask.dataframe.compute(*args, traverse=True, optimize_graph=True, scheduler=None, get=None, **kwargs)[源代码]¶
一次计算多个 dask 集合。
- 参数
- 参数对象
任意数量的对象。如果是 dask 对象,则会计算并返回结果。默认情况下,也会遍历 Python 内置集合以查找 dask 对象(更多信息请参见
traverse
关键字)。非 dask 参数保持不变。- 遍历bool, 可选
默认情况下,dask 会遍历内置的 Python 集合,查找传递给
compute
的 dask 对象。对于大型集合,这可能会很耗费资源。如果没有任何参数包含 dask 对象,请设置traverse=False
以避免进行此遍历。- 调度器字符串,可选
使用哪种调度器,如“线程”、“同步”或“进程”。如果没有提供,默认首先检查全局设置,然后回退到集合的默认设置。
- 优化图bool, 可选
如果为 True [默认],则在计算之前对每个集合应用优化。否则,图表将按原样运行。这对于调试很有用。
- 获取 :
None
无 应保留为
None
get= 关键字已被移除。- kwargs
传递给调度器函数的额外关键字参数。
示例
>>> import dask >>> import dask.array as da >>> a = da.arange(10, chunks=2).sum() >>> b = da.arange(10, chunks=2).mean() >>> dask.compute(a, b) (np.int64(45), np.float64(4.5))
默认情况下,python集合中的dask对象也会被计算:
>>> dask.compute({'a': a, 'b': b, 'c': 1}) ({'a': np.int64(45), 'b': np.float64(4.5), 'c': 1},)