pandas.util.hash_pandas_object#

pandas.util.hash_pandas_object(obj, index=True, encoding='utf8', hash_key='0123456789123456', categorize=True)[源代码][源代码]#

返回 Index/Series/DataFrame 的数据哈希。

参数:
obj索引, 序列, 或 数据框
索引布尔值, 默认为 True

在哈希中包含索引(如果是 Series/DataFrame)。

编码str, 默认 ‘utf8’

数据和密钥的字符串编码

hash_keystr, 默认 _default_hash_key

用于编码字符串键的哈希键。

分类布尔值, 默认为 True

是否在哈希之前先对对象数组进行分类。当数组包含重复值时,这会更有效。

返回:
一系列的 uint64

与对象长度相同。

例子

>>> pd.util.hash_pandas_object(pd.Series([1, 2, 3]))
0    14639053686158035780
1     3869563279212530728
2      393322362522515241
dtype: uint64