pandas.util.hash_array#
- pandas.util.hash_array(vals, encoding='utf8', hash_key='0123456789123456', categorize=True)[源代码][源代码]#
给定一个一维数组,返回一个确定性整数数组。
- 参数:
- valsndarray 或 ExtensionArray
要哈希的输入数组。
- 编码str, 默认 ‘utf8’
字符串的数据和密钥编码
- hash_keystr, 默认 _default_hash_key
用于编码字符串键的哈希键。
- 分类布尔值, 默认为 True
是否在哈希之前先对对象数组进行分类。当数组包含重复值时,这会更有效。
- 返回:
- ndarray[np.uint64, ndim=1]
哈希值,长度与 vals 相同。
参见
util.hash_pandas_object
返回 Index/Series/DataFrame 的数据哈希。
util.hash_tuples
高效地对 MultiIndex / 类似列表的元组进行哈希处理。
例子
>>> pd.util.hash_array(np.array([1, 2, 3])) array([ 6238072747940578789, 15839785061582574730, 2185194620014831856], dtype=uint64)