dask.array.histogram2d
dask.array.histogram2d¶
- dask.array.histogram2d(x, y, bins=10, range=None, normed=None, weights=None, density=None)[源代码]¶
被阻塞的
numpy.histogram2d()
变体。- 参数
- xdask.array.Array
包含要进行直方图处理的点的 x 坐标的数组。
- ydask.array.Array
包含要进行直方图统计的点的 y 坐标的数组。
- bins描述箱边的数组序列,整数,或整数序列
bin 规范。关于所有可能的 bin 配置的完整描述,请参阅
histogramdd()
的 bins 参数描述(此函数是 histogramdd 的二维特定版本)。- 范围成对元组,可选。
当整数传递给 bins 时,每个维度上箱子的最左和最右边缘;形式为:((xmin, xmax), (ymin, ymax))。
- 标准化bool, 可选
这是密度参数的一个别名,其行为完全相同。为了避免与 histogram 函数中的损坏参数混淆,应优先使用 density。
- 权重dask.array.Array, 可选
一个权重值的数组,用于衡量输入数据中的每个样本。权重的块必须与数据样本沿第0轴(行)的块相同。
- 密度bool, 可选
如果为 False(默认值),返回每个箱子中的样本数量。如果为 True,返回的数组表示每个箱子的概率密度函数。
- 返回
- dask.array.Array
直方图的值。
- dask.array.Array
沿 x 维度的边缘。
- dask.array.Array
沿 y 维度的边缘。
示例
>>> import dask.array as da >>> x = da.array([2, 4, 2, 4, 2, 4]) >>> y = da.array([2, 2, 4, 4, 2, 4]) >>> bins = 2 >>> range = ((0, 6), (0, 6)) >>> h, xedges, yedges = da.histogram2d(x, y, bins=bins, range=range) >>> h dask.array<sum-aggregate, shape=(2, 2), dtype=float64, chunksize=(2, 2), chunktype=numpy.ndarray> >>> xedges dask.array<array, shape=(3,), dtype=float64, chunksize=(3,), chunktype=numpy.ndarray> >>> h.compute() array([[2., 1.], [1., 2.]])