pandas.CategoricalDtype#

class pandas.CategoricalDtype(categories=None, ordered=False)[源代码][源代码]#

用于分类数据的类型,包含类别和有序性。

参数:
类别序列, 可选

必须是唯一的,并且不能包含任何空值。类别存储在一个索引中,如果提供了索引,则将使用该索引的dtype。

有序布尔值或无,默认 False

这个分类是否被视为有序分类。在组合分类的操作中(例如 astype),可以使用 None 来保持现有分类的有序值,如果没有现有的有序值需要保持,则会解析为 False。

属性

类别

一个包含允许的唯一类别的 Index

有序

类别是否有有序关系。

方法

None

参见

分类

以经典的 R / S-plus 风格表示一个分类变量。

备注

这个类对于指定 Categorical 的类型非常有用,而与值无关。更多信息请参见 CategoricalDtype

例子

>>> t = pd.CategoricalDtype(categories=["b", "a"], ordered=True)
>>> pd.Series(["a", "b", "a", "c"], dtype=t)
0      a
1      b
2      a
3    NaN
dtype: category
Categories (2, object): ['b' < 'a']

通过提供一个空索引,可以创建一个具有特定dtype的空CategoricalDtype。如下所示,

>>> pd.CategoricalDtype(pd.DatetimeIndex([])).categories.dtype
dtype('<M8[s]')