dask_expr._collection.DataFrame.categorize

dask_expr._collection.DataFrame.categorize

DataFrame.categorize(columns=None, index=None, split_every=None, **kwargs)[源代码]

将 DataFrame 的列转换为类别数据类型。

警告

此方法会急切地计算所选列的类别。

参数
列表,可选

要转换为分类的列名列表。默认情况下,任何具有对象数据类型的列都会被转换为分类,任何未知的分类都会被识别。

索引bool, 可选

是否对索引进行分类。默认情况下,对象索引会被转换为分类类型,未知的分类索引会被识别。设置为 True 则始终对索引进行分类,设置为 False 则从不进行分类。

split_everyint, 可选

在进行树形缩减时,将组分区为这个大小的组。如果设置为 False,则不会使用树形缩减。

kwargs

关键字参数被传递给计算。