numpy.partition#

numpy.partition(a, kth, axis=-1, kind='introselect', order=None)[源代码]#

返回数组的分区副本.

创建数组的一个副本,并以这样的方式对其进行部分排序,即第 k 个位置的元素值在排序后的数组中处于其应有的位置.在输出数组中,所有小于第 k 个元素的元素都位于该元素的左侧,所有等于或大于该元素的元素都位于其右侧.输出数组中第 k 个元素两侧的两个分区的元素顺序未定义.

在 1.8.0 版本加入.

参数:

aarray_like: 要排序的数组.
kth整数或整数序列: 按其分区的元素索引.元素的第k个值将处于其最终排序位置,并且所有较小的元素将移到它前面,所有相等或更大的元素将移到它后面.分区中所有元素的顺序未定义.如果提供了一个k-th序列,它将一次性将由k-th索引的所有元素分区到其排序位置.

自 1.22.0 版本弃用: 将布尔值作为索引传递已被弃用.
axis整数或无,可选: 要排序的轴.如果为 None,则在排序之前将数组展平.默认值为 -1,即沿最后一个轴排序.
kind{‘introselect’}, 可选: 选择算法.默认是 ‘introselect’.
orderstr 或 str 列表,可选: 当 a 是一个定义了字段的数组时,此参数指定首先比较哪些字段,其次比较哪些字段等.单个字段可以指定为字符串.并非所有字段都需要指定,但未指定的字段仍将使用,按照它们在 dtype 中出现的顺序来打破平局.

返回:

partitioned_arrayndarray: 与 a 类型和形状相同的数组.

参见

ndarray.partition: 在原地对数组进行排序的方法.
argpartition: 间接分区.
sort: 完全排序

备注

各种选择算法的特点是它们的平均速度、最坏情况性能、工作空间大小以及它们是否稳定.稳定的排序保持具有相同键的项在相同的相对顺序.可用的算法具有以下属性:

种类	速度	最坏情况	工作空间	stable
‘introselect’	1	O(n)	0	不

所有分区算法在沿除最后一个轴以外的任何轴进行分区时都会创建数据的临时副本.因此,沿最后一个轴进行分区比沿其他任何轴进行分区更快且使用更少的内存.

复数的排序顺序是字典序.如果实部和虚部都不是非数字（non-nan）,则顺序由实部决定,除非它们相等,在这种情况下,顺序由虚部决定.

np.nan 的排序顺序大于 np.inf.

示例

>>> import numpy as np
>>> a = np.array([7, 1, 7, 7, 1, 5, 7, 2, 3, 2, 6, 2, 3, 0])
>>> p = np.partition(a, 4)
>>> p
array([0, 1, 2, 1, 2, 5, 2, 3, 3, 6, 7, 7, 7, 7]) # may vary

p[4] 是 2; p[:4] 中的所有元素都小于或等于 p[4],而 p[5:] 中的所有元素都大于或等于 p[4].分区如下:

[0, 1, 2, 1], [2], [5, 2, 3, 3, 6, 7, 7, 7, 7]

下一个示例展示了传递给 kth 的多个值的使用.

>>> p2 = np.partition(a, (4, 8))
>>> p2
array([0, 1, 2, 1, 2, 3, 3, 2, 5, 6, 7, 7, 7, 7])

p2[4] 是 2 而 p2[8] 是 5. p2[:4] 中的所有元素都小于或等于 p2[4], p2[5:8] 中的所有元素都大于或等于 p2[4] 且小于或等于 p2[8],而 p2[9:] 中的所有元素都大于或等于 p2[8]. 分区如下:

[0, 1, 2, 1], [2], [3, 3, 2], [5], [6, 7, 7, 7, 7]