jax.numpy.histogram_bin_edges

jax.numpy.histogram_bin_edges#

jax.numpy.histogram_bin_edges(a, bins=10, range=None, weights=None)[源代码][源代码]#

用于计算 histogram 使用的箱子边缘的函数

LAX-backend 实现的 numpy.histogram_bin_edges()

原始文档字符串如下。

函数

参数:
  • a (array_like) – 输入数据。直方图是基于展平后的数组计算的。

  • bins (int or sequence of scalars or str, optional) – 如果 bins 是一个整数,它定义了给定范围内等宽的箱数(默认是10个)。如果 bins 是一个序列,它定义了箱的边缘,包括最右边的边缘,允许非均匀的箱宽。如果 bins 是下面列表中的一个字符串,histogram_bin_edges 将使用所选方法计算最佳箱宽,从而计算出箱的数量(有关估计器的更多详细信息,请参见注释部分),这些箱的数量是从请求范围内落入的数据中计算出来的。虽然箱宽对于范围内的实际数据将是最佳的,但箱的数量将被计算以填充整个范围,包括空的部分。对于可视化,建议使用 ‘auto’ 选项。不支持加权数据的自动箱大小选择。 ‘auto’ 在 ‘sturges’ 和 ‘fd’ 估计器之间的最小箱宽。 提供良好的全方位性能。 ‘fd’ (Freedman Diaconis 估计器) 一个鲁棒(对异常值有抵抗力)的估计器,它考虑了数据的变异性和数据大小。 ‘doane’ 一个改进的 Sturges 估计器,对非正态数据集效果更好。 ‘scott’ 一个较不鲁棒的估计器,它考虑了数据的变异性和数据大小。 ‘stone’ 基于留一交叉验证估计的积分平方误差的估计器。可以被视为 Scott 规则的推广。 ‘rice’ 估计器不考虑变异性,只考虑数据大小。通常会高估所需的箱数。 ‘sturges’ R 的默认方法,只考虑数据大小。仅对高斯数据最优,对大型非高斯数据集低估了箱数。 ‘sqrt’ 数据大小的平方根估计器,由 Excel 和其他程序使用,因其速度和简单性。

  • range ((float, float), optional) – 箱子的下限和上限范围。如果没有提供,范围就是 (a.min(), a.max())。超出范围的值将被忽略。范围的第一个元素必须小于或等于第二个元素。range 也会影响自动箱子计算。虽然箱子宽度是根据 range 内的实际数据计算为最佳值,但箱子数量将填充整个范围,包括不包含数据的区域。

  • weights (array_like, optional) – 一个权重数组,形状与 a 相同。a 中的每个值仅将其相关权重贡献给箱计数(而不是 1)。目前,这不被任何箱估计器使用,但未来可能会使用。

返回:

bin_edges – 传递给 histogram 的边缘

返回类型:

array of dtype float