dask.dataframe.DataFrame.categorize

dask.dataframe.DataFrame.categorize

DataFrame.categorize(columns=None, index=None, split_every=None, **kwargs)

将 DataFrame 的列转换为类别数据类型。

参数
列表,可选

要转换为分类的列名列表。默认情况下,任何具有对象数据类型的列都会被转换为分类,任何未知的分类都会被识别。

索引bool, 可选

是否对索引进行分类。默认情况下,对象索引会被转换为分类类型,未知的分类索引会被识别。设置为 True 则始终对索引进行分类,设置为 False 则从不进行分类。

split_everyint, 可选

在进行树形缩减时,将组分区为该大小的组。如果设置为 False,则不会使用树形缩减。默认值为 16。

kwargs

关键字参数被传递给计算。