dask.array.nanmedian

dask.array.nanmedian

dask.array.nanmedian(a, axis=None, keepdims=False, out=None)[源代码]

沿指定轴计算中位数,同时忽略 NaNs。

此文档字符串是从 numpy.nanmedian 复制的。

Dask 版本可能存在一些不一致性。

这通过自动将减少的轴分块为一个块,然后跨剩余维度调用 numpy.nanmedian 函数来实现。

返回数组元素的中位数。

1.9.0 新版功能.

参数
aarray_like

可以转换为数组的输入数组或对象。

{int, 整数序列, None}, 可选

计算中位数所沿的轴或轴。默认是计算数组展平版本的中位数。自版本1.9.0起,支持轴的序列。

ndarray,可选

可选的输出数组,用于放置结果。它必须具有与预期输出相同的形状和缓冲区长度,但如果需要,输出类型将被强制转换。

overwrite_inputbool, 可选 (Dask 不支持)

如果为 True,则允许使用输入数组 a 的内存进行计算。调用 median 时将修改输入数组。当你不需要保留输入数组的原始内容时,这将节省内存。输入数组将被视为未定义,但它可能会被完全或部分排序。默认值为 False。如果 overwrite_inputTruea 还不是 ndarray,则会引发错误。

keepdimsbool, 可选

如果设置为 True,被减少的轴将作为尺寸为1的维度保留在结果中。使用此选项,结果将与原始 a 正确广播。

如果这不是默认值,它将被传递(在空数组的特殊情况下)到底层数组的 mean 函数。如果数组是一个子类,并且 mean 没有 keepdims 这个关键字参数,这将引发一个 RuntimeError。

返回
中位数ndarray

一个保存结果的新数组。如果输入包含小于 float64 的整数或浮点数,则输出数据类型为 np.float64。否则,输出的数据类型与输入的数据类型相同。如果指定了 out,则返回该数组。

注释

给定一个长度为 N 的向量 VV 的中位数是 V 的排序副本 V_sorted 的中间值 - 即,当 N 为奇数时,V_sorted[(N-1)/2],当 N 为偶数时,V_sorted 的两个中间值的平均值。

示例

>>> import numpy as np  
>>> a = np.array([[10.0, 7, 4], [3, 2, 1]])  
>>> a[0, 1] = np.nan  
>>> a  
array([[10., nan,  4.],
       [ 3.,  2.,  1.]])
>>> np.median(a)  
np.float64(nan)
>>> np.nanmedian(a)  
3.0
>>> np.nanmedian(a, axis=0)  
array([6.5, 2. , 2.5])
>>> np.median(a, axis=1)  
array([nan,  2.])
>>> b = a.copy()  
>>> np.nanmedian(b, axis=1, overwrite_input=True)  
array([7.,  2.])
>>> assert not np.all(a==b)  
>>> b = a.copy()  
>>> np.nanmedian(b, axis=None, overwrite_input=True)  
3.0
>>> assert not np.all(a==b)