统计数据
内容
统计数据¶
Dask Array 实现了 scipy.stats 包的一个子集。
统计函数¶
你可以计算数组的各种度量,包括偏度、峰度和任意矩。
>>> from dask.array import stats
>>> rng = da.random.default_rng()
>>> x = rng.beta(1, 1, size=(1000,), chunks=10)
>>> k, s, m = [stats.kurtosis(x), stats.skew(x), stats.moment(x, 5)]
>>> dask.compute(k, s, m)
(1.7612340817172787, -0.064073498030693302, -0.00054523780628304799)
统计检验¶
您可以对 Dask 数组执行基本的统计测试。这些测试中的每一个都会返回一个 dask.delayed
包装的 scipy namedtuple
结果。
>>> rng = da.random.default_rng()
>>> a = rng.uniform(size=(50,), chunks=(25,))
>>> b = a + rng.uniform(low=-0.15, high=0.15, size=(50,), chunks=(25,))
>>> result = stats.ttest_rel(a, b)
>>> result.compute()
Ttest_relResult(statistic=-1.5102104380013242, pvalue=0.13741197274874514)