LabelEncoder#

class sklearn.preprocessing.LabelEncoder#

编码目标标签,使其值在0到n_classes-1之间。

这个转换器应用于编码目标值,即 y ,而不是输入 X

更多信息请参阅 用户指南

Added in version 0.12.

Attributes:
classes_ndarray 形状为 (n_classes,)

保存每个类别的标签。

See also

OrdinalEncoder

使用序数编码方案编码分类特征。

OneHotEncoder

将分类特征编码为独热数值数组。

Examples

LabelEncoder 可以用于标准化标签。

>>> from sklearn.preprocessing import LabelEncoder
>>> le = LabelEncoder()
>>> le.fit([1, 2, 2, 6])
LabelEncoder()
>>> le.classes_
array([1, 2, 6])
>>> le.transform([1, 1, 2, 6])
array([0, 0, 1, 2]...)
>>> le.inverse_transform([0, 0, 1, 2])
array([1, 1, 2, 6])

它还可以用于将非数值标签(只要它们是可哈希且可比较的)转换为数值标签。

>>> le = LabelEncoder()
>>> le.fit(["paris", "paris", "tokyo", "amsterdam"])
LabelEncoder()
>>> list(le.classes_)
['amsterdam', 'paris', 'tokyo']
>>> le.transform(["tokyo", "tokyo", "paris"])
array([2, 2, 1]...)
>>> list(le.inverse_transform([2, 2, 1]))
['tokyo', 'tokyo', 'paris']
fit(y)#

适配标签编码器。

Parameters:
yarray-like of shape (n_samples,)

目标值。

Returns:
selfreturns an instance of self.

适配后的标签编码器。

fit_transform(y)#

拟合标签编码器并返回编码后的标签。

Parameters:
y形状为 (n_samples,) 的类数组

目标值。

Returns:
y形状为 (n_samples,) 的类数组

编码后的标签。

get_metadata_routing()#

获取此对象的元数据路由。

请查看 用户指南 以了解路由机制的工作原理。

Returns:
routingMetadataRequest

MetadataRequest 封装的 路由信息。

get_params(deep=True)#

获取此估计器的参数。

Parameters:
deepbool, 默认=True

如果为True,将返回此估计器和包含的子对象(也是估计器)的参数。

Returns:
paramsdict

参数名称映射到它们的值。

inverse_transform(y)#

将标签转换回原始编码。

Parameters:
yarray-like of shape (n_samples,)

目标值。

Returns:
yndarray of shape (n_samples,)

原始编码。

set_output(*, transform=None)#

设置输出容器。

请参阅 介绍 set_output API 以了解如何使用API的示例。

Parameters:
transform{“default”, “pandas”, “polars”}, 默认=None

配置 transformfit_transform 的输出。

  • "default" : 转换器的默认输出格式

  • "pandas" : DataFrame 输出

  • "polars" : Polars 输出

  • None : 转换配置不变

Added in version 1.4: "polars" 选项已添加。

Returns:
self估计器实例

估计器实例。

set_params(**params)#

设置此估计器的参数。

该方法适用于简单估计器以及嵌套对象(例如 Pipeline )。后者具有形式为 <component>__<parameter> 的参数,以便可以更新嵌套对象的每个组件。

Parameters:
**paramsdict

估计器参数。

Returns:
selfestimator instance

估计器实例。

transform(y)#

转换标签为标准化编码。

Parameters:
y形状为 (n_samples,) 的类数组

目标值。

Returns:
y形状为 (n_samples,) 的类数组

标准化编码的标签。