dask.array.histogram2d

dask.array.histogram2d

dask.array.histogram2d(x, y, bins=10, range=None, normed=None, weights=None, density=None)[源代码]

被阻塞的 numpy.histogram2d() 变体。

参数
xdask.array.Array

包含要进行直方图处理的点的 x 坐标的数组。

ydask.array.Array

包含要进行直方图统计的点的 y 坐标的数组。

bins描述箱边的数组序列,整数,或整数序列

bin 规范。关于所有可能的 bin 配置的完整描述,请参阅 histogramdd()bins 参数描述(此函数是 histogramdd 的二维特定版本)。

范围成对元组,可选。

当整数传递给 bins 时,每个维度上箱子的最左和最右边缘;形式为:((xmin, xmax), (ymin, ymax))。

标准化bool, 可选

这是密度参数的一个别名,其行为完全相同。为了避免与 histogram 函数中的损坏参数混淆,应优先使用 density

权重dask.array.Array, 可选

一个权重值的数组,用于衡量输入数据中的每个样本。权重的块必须与数据样本沿第0轴(行)的块相同。

密度bool, 可选

如果为 False(默认值),返回每个箱子中的样本数量。如果为 True,返回的数组表示每个箱子的概率密度函数。

返回
dask.array.Array

直方图的值。

dask.array.Array

沿 x 维度的边缘。

dask.array.Array

沿 y 维度的边缘。

示例

>>> import dask.array as da
>>> x = da.array([2, 4, 2, 4, 2, 4])
>>> y = da.array([2, 2, 4, 4, 2, 4])
>>> bins = 2
>>> range = ((0, 6), (0, 6))
>>> h, xedges, yedges = da.histogram2d(x, y, bins=bins, range=range)
>>> h
dask.array<sum-aggregate, shape=(2, 2), dtype=float64, chunksize=(2, 2), chunktype=numpy.ndarray>
>>> xedges
dask.array<array, shape=(3,), dtype=float64, chunksize=(3,), chunktype=numpy.ndarray>
>>> h.compute()
array([[2., 1.],
       [1., 2.]])