dask.dataframe.compute

dask.dataframe.compute

dask.dataframe.compute(*args, traverse=True, optimize_graph=True, scheduler=None, get=None, **kwargs)[源代码]

一次计算多个 dask 集合。

参数
参数对象

任意数量的对象。如果是 dask 对象,则会计算并返回结果。默认情况下,也会遍历 Python 内置集合以查找 dask 对象(更多信息请参见 traverse 关键字)。非 dask 参数保持不变。

遍历bool, 可选

默认情况下,dask 会遍历内置的 Python 集合,查找传递给 compute 的 dask 对象。对于大型集合,这可能会很耗费资源。如果没有任何参数包含 dask 对象,请设置 traverse=False 以避免进行此遍历。

调度器字符串,可选

使用哪种调度器,如“线程”、“同步”或“进程”。如果没有提供,默认首先检查全局设置,然后回退到集合的默认设置。

优化图bool, 可选

如果为 True [默认],则在计算之前对每个集合应用优化。否则,图表将按原样运行。这对于调试很有用。

获取 : None

应保留为 None get= 关键字已被移除。

kwargs

传递给调度器函数的额外关键字参数。

示例

>>> import dask
>>> import dask.array as da
>>> a = da.arange(10, chunks=2).sum()
>>> b = da.arange(10, chunks=2).mean()
>>> dask.compute(a, b)
(np.int64(45), np.float64(4.5))

默认情况下,python集合中的dask对象也会被计算:

>>> dask.compute({'a': a, 'b': b, 'c': 1})
({'a': np.int64(45), 'b': np.float64(4.5), 'c': 1},)