PassiveAggressiveRegressor#
- class sklearn.linear_model.PassiveAggressiveRegressor(*, C=1.0, fit_intercept=True, max_iter=1000, tol=0.001, early_stopping=False, validation_fraction=0.1, n_iter_no_change=5, shuffle=True, verbose=0, loss='epsilon_insensitive', epsilon=0.1, random_state=None, warm_start=False, average=False)#
被动攻击回归器。
更多信息请参阅 用户指南 。
- Parameters:
- Cfloat, 默认=1.0
最大步长(正则化)。默认值为1.0。
- fit_interceptbool, 默认=True
是否应该估计截距。如果为False,则假定数据已经中心化。默认值为True。
- max_iterint, 默认=1000
对训练数据的最大遍历次数(即epochs)。它仅影响
fit
方法的行为,而不影响:meth:~sklearn.linear_model.PassiveAggressiveRegressor.partial_fit
方法。Added in version 0.19.
- tolfloat 或 None, 默认=1e-3
停止标准。如果它不是None,当(损失 > 前一次损失 - tol)时,迭代将停止。
Added in version 0.19.
- early_stoppingbool, 默认=False
是否使用提前停止来终止训练,当验证分数没有改善时。如果设置为True,它将自动留出一部分训练数据作为验证集,并在验证分数至少没有改善tol的情况下连续n_iter_no_change个epochs后终止训练。
Added in version 0.20.
- validation_fractionfloat, 默认=0.1
留出作为验证集的训练数据比例。必须在0和1之间。仅在early_stopping为True时使用。
Added in version 0.20.
- n_iter_no_changeint, 默认=5
在提前停止之前等待的没有改善的迭代次数。
Added in version 0.20.
- shufflebool, 默认=True
是否应在每个epoch后打乱训练数据。
- verboseint, 默认=0
详细级别。
- lossstr, 默认=”epsilon_insensitive”
要使用的损失函数: epsilon_insensitive: 相当于参考论文中的PA-I。 squared_epsilon_insensitive: 相当于参考论文中的PA-II。
- epsilonfloat, 默认=0.1
如果当前预测与正确标签之间的差异低于此阈值,则不更新模型。
- random_stateint, RandomState 实例, 默认=None
用于在
shuffle
设置为True
时打乱训练数据。为多个函数调用提供可重复的输出,请传递一个int。 请参阅 Glossary 。- warm_startbool, 默认=False
当设置为True时,重用上一次调用fit的解决方案作为初始化,否则,只需擦除之前的解决方案。 请参阅 the Glossary 。
当warm_start为True时,反复调用fit或partial_fit可能会导致与单次调用fit不同的解决方案,因为数据被打乱的方式不同。
- averagebool 或 int, 默认=False
当设置为True时,计算平均SGD权重并将其存储在
coef_
属性中。如果设置为大于1的int,则在看到的样本总数达到average后开始平均。因此average=10将在看到10个样本后开始平均。Added in version 0.19: 参数 average 用于在SGD中使用权重平均。
- Attributes:
- coef_array, shape = [1, n_features] 如果 n_classes == 2 否则 [n_classes, n_features]
分配给特征的权重。
- intercept_array, shape = [1] 如果 n_classes == 2 否则 [n_classes]
决策函数中的常数。
- n_features_in_int
在 fit 期间看到的特征数量。
Added in version 0.24.
- feature_names_in_ndarray of shape (
n_features_in_
,) 在 fit 期间看到的特征名称。仅当
X
的特征名称均为字符串时定义。Added in version 1.0.
- n_iter_int
达到停止标准所需的实际迭代次数。
- t_int
训练期间执行的权重更新次数。 与
(n_iter_ * n_samples + 1)
相同。
See also
SGDRegressor
通过最小化正则化经验损失的SGD拟合的线性模型。
References
在线被动-攻击算法 <http://jmlr.csail.mit.edu/papers/volume7/crammer06a/crammer06a.pdf> K. Crammer, O. Dekel, J. Keshat, S. Shalev-Shwartz, Y. Singer - JMLR (2006).
Examples
>>> from sklearn.linear_model import PassiveAggressiveRegressor >>> from sklearn.datasets import make_regression
>>> X, y = make_regression(n_features=4, random_state=0) >>> regr = PassiveAggressiveRegressor(max_iter=100, random_state=0, ... tol=1e-3) >>> regr.fit(X, y) PassiveAggressiveRegressor(max_iter=100, random_state=0) >>> print(regr.coef_) [20.48736655 34.18818427 67.59122734 87.94731329] >>> print(regr.intercept_) [-0.02306214] >>> print(regr.predict([[0, 0, 0, 0]])) [-0.02306214]
- densify()#
将系数矩阵转换为密集数组格式。
将
coef_
成员(回)转换为 numpy.ndarray。这是coef_
的默认格式,并且是拟合所必需的,因此只有在之前已经稀疏化的模型上才需要调用此方法;否则,它是一个空操作。- Returns:
- self
拟合的估计器。
- fit(X, y, coef_init=None, intercept_init=None)#
拟合使用Passive Aggressive算法的线性模型。
- Parameters:
- X{array-like, sparse matrix},形状为 (n_samples, n_features)
训练数据。
- ynumpy array,形状为 [n_samples]
目标值。
- coef_initarray,形状为 [n_features]
用于优化热启动的初始系数。
- intercept_initarray,形状为 [1]
用于优化热启动的初始截距。
- Returns:
- selfobject
拟合的估计器。
- get_metadata_routing()#
获取此对象的元数据路由。
请查看 用户指南 以了解路由机制的工作原理。
- Returns:
- routingMetadataRequest
MetadataRequest
封装的 路由信息。
- get_params(deep=True)#
获取此估计器的参数。
- Parameters:
- deepbool, 默认=True
如果为True,将返回此估计器和包含的子对象(也是估计器)的参数。
- Returns:
- paramsdict
参数名称映射到它们的值。
- partial_fit(X, y)#
拟合使用被动攻击算法的线性模型。
- Parameters:
- X{array-like, sparse matrix},形状为 (n_samples, n_features)
训练数据的子集。
- ynumpy array,形状为 [n_samples]
目标值的子集。
- Returns:
- selfobject
拟合的估计器。
- predict(X)#
使用线性模型进行预测。
- Parameters:
- X{array-like, sparse matrix}, shape (n_samples, n_features)
输入数据。
- Returns:
- shape (n_samples,) 的 ndarray
对 X 中每个元素预测的目标值。
- score(X, y, sample_weight=None)#
返回预测的决定系数。
决定系数 \(R^2\) 定义为 \((1 - rac{u}{v})\) ,其中 \(u\) 是残差平方和
((y_true - y_pred)** 2).sum()
,而 \(v\) 是总平方和((y_true - y_true.mean()) ** 2).sum()
。最好的可能得分是 1.0,它可能是负的(因为模型可能任意地差)。一个总是预测y
的期望值的常数模型,忽略输入特征,将得到 \(R^2\) 得分为 0.0。- Parameters:
- Xarray-like of shape (n_samples, n_features)
测试样本。对于某些估计器,这可能是一个预计算的核矩阵或一个形状为
(n_samples, n_samples_fitted)
的通用对象列表,其中n_samples_fitted
是估计器拟合中使用的样本数量。- yarray-like of shape (n_samples,) or (n_samples, n_outputs)
X
的真实值。- sample_weightarray-like of shape (n_samples,), default=None
样本权重。
- Returns:
- scorefloat
\(R^2\) 相对于
y
的self.predict(X)
。
Notes
在调用回归器的
score
时使用的 \(R^2\) 得分从 0.23 版本开始使用multioutput='uniform_average'
以保持与r2_score
默认值一致。 这影响了所有多输出回归器的score
方法(除了MultiOutputRegressor
)。
- set_fit_request(*, coef_init: bool | None | str = '$UNCHANGED$', intercept_init: bool | None | str = '$UNCHANGED$') PassiveAggressiveRegressor #
Request metadata passed to the
fit
method.Note that this method is only relevant if
enable_metadata_routing=True
(seesklearn.set_config
). Please see User Guide on how the routing mechanism works.The options for each parameter are:
True
: metadata is requested, and passed tofit
if provided. The request is ignored if metadata is not provided.False
: metadata is not requested and the meta-estimator will not pass it tofit
.None
: metadata is not requested, and the meta-estimator will raise an error if the user provides it.str
: metadata should be passed to the meta-estimator with this given alias instead of the original name.
The default (
sklearn.utils.metadata_routing.UNCHANGED
) retains the existing request. This allows you to change the request for some parameters and not others.Added in version 1.3.
Note
This method is only relevant if this estimator is used as a sub-estimator of a meta-estimator, e.g. used inside a
Pipeline
. Otherwise it has no effect.- Parameters:
- coef_initstr, True, False, or None, default=sklearn.utils.metadata_routing.UNCHANGED
Metadata routing for
coef_init
parameter infit
.- intercept_initstr, True, False, or None, default=sklearn.utils.metadata_routing.UNCHANGED
Metadata routing for
intercept_init
parameter infit
.
- Returns:
- selfobject
The updated object.
- set_params(**params)#
设置此估计器的参数。
该方法适用于简单估计器以及嵌套对象(例如
Pipeline
)。后者具有形式为<component>__<parameter>
的参数,以便可以更新嵌套对象的每个组件。- Parameters:
- **paramsdict
估计器参数。
- Returns:
- selfestimator instance
估计器实例。
- set_partial_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') PassiveAggressiveRegressor #
Request metadata passed to the
partial_fit
method.Note that this method is only relevant if
enable_metadata_routing=True
(seesklearn.set_config
). Please see User Guide on how the routing mechanism works.The options for each parameter are:
True
: metadata is requested, and passed topartial_fit
if provided. The request is ignored if metadata is not provided.False
: metadata is not requested and the meta-estimator will not pass it topartial_fit
.None
: metadata is not requested, and the meta-estimator will raise an error if the user provides it.str
: metadata should be passed to the meta-estimator with this given alias instead of the original name.
The default (
sklearn.utils.metadata_routing.UNCHANGED
) retains the existing request. This allows you to change the request for some parameters and not others.Added in version 1.3.
Note
This method is only relevant if this estimator is used as a sub-estimator of a meta-estimator, e.g. used inside a
Pipeline
. Otherwise it has no effect.- Parameters:
- sample_weightstr, True, False, or None, default=sklearn.utils.metadata_routing.UNCHANGED
Metadata routing for
sample_weight
parameter inpartial_fit
.
- Returns:
- selfobject
The updated object.
- set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') PassiveAggressiveRegressor #
Request metadata passed to the
score
method.Note that this method is only relevant if
enable_metadata_routing=True
(seesklearn.set_config
). Please see User Guide on how the routing mechanism works.The options for each parameter are:
True
: metadata is requested, and passed toscore
if provided. The request is ignored if metadata is not provided.False
: metadata is not requested and the meta-estimator will not pass it toscore
.None
: metadata is not requested, and the meta-estimator will raise an error if the user provides it.str
: metadata should be passed to the meta-estimator with this given alias instead of the original name.
The default (
sklearn.utils.metadata_routing.UNCHANGED
) retains the existing request. This allows you to change the request for some parameters and not others.Added in version 1.3.
Note
This method is only relevant if this estimator is used as a sub-estimator of a meta-estimator, e.g. used inside a
Pipeline
. Otherwise it has no effect.- Parameters:
- sample_weightstr, True, False, or None, default=sklearn.utils.metadata_routing.UNCHANGED
Metadata routing for
sample_weight
parameter inscore
.
- Returns:
- selfobject
The updated object.
- sparsify()#
将系数矩阵转换为稀疏格式。
将
coef_
成员转换为 scipy.sparse 矩阵,对于 L1 正则化模型来说,这种格式在内存和存储方面比通常的 numpy.ndarray 表示更高效。intercept_
成员不会被转换。- Returns:
- self
拟合的估计器。
Notes
对于非稀疏模型,即当
coef_
中没有很多零时,这实际上可能会增加内存使用量,因此请谨慎使用此方法。一个经验法则是,零元素的数量,可以通过(coef_ == 0).sum()
计算,必须超过 50% 才能提供显著的效益。调用此方法后,进一步使用 partial_fit 方法(如果有)进行拟合将不起作用,直到您调用 densify。