pandas.util.hash_pandas_object#
- pandas.util.hash_pandas_object(obj, index=True, encoding='utf8', hash_key='0123456789123456', categorize=True)[源代码][源代码]#
返回 Index/Series/DataFrame 的数据哈希。
- 参数:
- obj索引, 序列, 或 数据框
- 索引布尔值, 默认为 True
在哈希中包含索引(如果是 Series/DataFrame)。
- 编码str, 默认 ‘utf8’
数据和密钥的字符串编码
- hash_keystr, 默认 _default_hash_key
用于编码字符串键的哈希键。
- 分类布尔值, 默认为 True
是否在哈希之前先对对象数组进行分类。当数组包含重复值时,这会更有效。
- 返回:
- 一系列的 uint64
与对象长度相同。
例子
>>> pd.util.hash_pandas_object(pd.Series([1, 2, 3])) 0 14639053686158035780 1 3869563279212530728 2 393322362522515241 dtype: uint64