numpy.in1d#

numpy.in1d(ar1, ar2, assume_unique=False, invert=False, *, kind=None)[源代码]#

测试一维数组中的每个元素是否也存在于第二个数组中.

自 2.0 版本弃用: 对于新代码,请使用 isin 而不是 in1d.

返回一个与 ar1 长度相同的布尔数组,其中 ar1 的元素在 ar2 中时为 True,否则为 False.

参数:
ar1(M,) array_like

输入数组.

ar2array_like

用于测试 ar1 每个值的值.

assume_uniquebool, 可选

如果为真,则假定输入数组都是唯一的,这可以加快计算速度.默认值为假.

invertbool, 可选

如果为True,返回数组中的值将被反转(即,`ar1`中的元素在`ar2`中时为False,否则为True).默认是False.``np.in1d(a, b, invert=True)`` 等价于(但比)``np.invert(in1d(a, b))`` 更快.

kind{None, ‘sort’, ‘table’}, 可选

要使用的算法.这不会影响最终结果,但会影响速度和内存使用.默认值 None 会根据内存考虑自动选择.

  • 如果使用 ‘sort’,将采用基于归并排序的方法.这将具有大约 ar1ar2 大小总和的 6 倍的内存使用量,不考虑 dtypes 的大小.

  • 如果为 ‘table’,将使用类似于计数排序的查找表方法.这仅适用于布尔和整数数组.这将使用 ar1 的大小加上 ar2 的最大-最小值的内存.当使用 ‘table’ 选项时,`assume_unique` 没有影响.

  • 如果为 None,如果所需的内存分配小于或等于 ar1ar2 大小总和的 6 倍,将自动选择 ‘table’,否则将使用 ‘sort’.这样做是为了默认情况下不使用大量内存,即使在大多数情况下 ‘table’ 可能更快.如果选择 ‘table’,`assume_unique` 将无效.

在 1.8.0 版本加入.

返回:
in1d(M,) ndarray, bool

ar1[in1d]ar2 中.

参见

isin

保留ar1形状的此函数的版本.

备注

in1d 可以被认为是 Python 关键字 in 的元素级函数版本,用于 1-D 序列.``in1d(a, b)`` 大致等同于 np.array([item in b for item in a]).然而,如果 ar2 是一个集合或类似的(非序列)容器,这个想法就会失败:因为 ar2 被转换为一个数组,在这些情况下 asarray(ar2) 是一个对象数组,而不是预期的包含值的数组.

使用 kind='table' 通常比 kind='sort' 更快,如果以下关系成立:log10(len(ar2)) > (log10(max(ar2)-min(ar2)) - 2.27) / 0.927,但可能会使用更多内存.`kind` 的默认值将仅基于内存使用情况自动选择,因此如果可以放宽内存限制,可以手动设置 kind='table'.

在 1.4.0 版本加入.

示例

>>> import numpy as np
>>> test = np.array([0, 1, 2, 5, 0])
>>> states = [0, 2]
>>> mask = np.in1d(test, states)
>>> mask
array([ True, False,  True, False,  True])
>>> test[mask]
array([0, 2, 0])
>>> mask = np.in1d(test, states, invert=True)
>>> mask
array([False,  True, False,  True, False])
>>> test[mask]
array([1, 5])