pandas.util.hash_array#

pandas.util.hash_array(vals, encoding='utf8', hash_key='0123456789123456', categorize=True)[源代码][源代码]#

给定一个一维数组,返回一个确定性整数数组。

参数:
valsndarray 或 ExtensionArray

要哈希的输入数组。

编码str, 默认 ‘utf8’

字符串的数据和密钥编码

hash_keystr, 默认 _default_hash_key

用于编码字符串键的哈希键。

分类布尔值, 默认为 True

是否在哈希之前先对对象数组进行分类。当数组包含重复值时,这会更有效。

返回:
ndarray[np.uint64, ndim=1]

哈希值,长度与 vals 相同。

参见

util.hash_pandas_object

返回 Index/Series/DataFrame 的数据哈希。

util.hash_tuples

高效地对 MultiIndex / 类似列表的元组进行哈希处理。

例子

>>> pd.util.hash_array(np.array([1, 2, 3]))
array([ 6238072747940578789, 15839785061582574730,  2185194620014831856],
  dtype=uint64)