dask_ml.linear_model.LinearRegression
dask_ml.linear_model
.LinearRegression¶
- class dask_ml.linear_model.LinearRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1.0, class_weight=None, random_state=None, solver='admm', max_iter=100, multi_class='ovr', verbose=0, warm_start=False, n_jobs=1, solver_kwargs=None)[源代码]¶
线性回归的估计器。
- 参数
- 惩罚str 或 Regularizer, 默认 ‘l2’
要使用的正则化器。仅与 ‘admm’、’lbfgs’ 和 ‘proximal_grad’ 求解器相关。
对于字符串值,只有 ‘l1’ 或 ‘l2’ 是有效的。
- 双布尔
忽略
- tolfloat, 默认值 1e-4
收敛的容差。
- C浮动
正则化强度。注意,
dask-glm
求解器使用参数化 \(\lambda = 1 / C\)- fit_interceptbool, 默认 True
指定是否应将常数(也称为偏差或截距)添加到决策函数中。
- intercept_scaling布尔
忽略
- class_weight字典或’平衡’
忽略
- random_stateint, RandomState, 或 None
伪随机数生成器的种子,用于在打乱数据时使用。如果为整数,random_state 是随机数生成器使用的种子;如果为 RandomState 实例,random_state 是随机数生成器;如果为 None,则随机数生成器是 np.random 使用的 RandomState 实例。当 solver == ‘sag’ 或 ‘liblinear’ 时使用。
- 求解器{‘admm’, ‘gradient_descent’, ‘newton’, ‘lbfgs’, ‘proximal_grad’}
要使用的求解器。详情请参见 Algorithms。
- max_iterint, 默认 100
求解器收敛所需的最大迭代次数。
- 多类str, 默认 ‘ovr’
忽略。目前不支持多类求解器。
- 详细int, 默认值为 0
忽略
- warm_startbool, 默认 False
忽略
- n_jobsint, 默认值为 1
忽略
- solver_kwargsdict, 可选, 默认 None
传递给求解器的额外关键字参数。
- 属性
- coef_array, 形状 (n_classes, n_features)
模型系数的学得值
- intercept_float of None
如果模型中添加了截距,则学习到的截距值
示例
>>> from dask_glm.datasets import make_regression >>> X, y = make_regression() >>> lr = LinearRegression() >>> lr.fit(X, y) >>> lr.predict(X) >>> lr.predict(X) >>> lr.score(X, y)
方法
fit
(X[, y])在训练数据上拟合模型
get_metadata_routing
()获取此对象的元数据路由。
get_params
([deep])获取此估计器的参数。
predict
(X)预测X中样本的值。
score
(X, y)返回预测的决定系数 R^2。
set_params
(**params)设置此估计器的参数。
- __init__(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1.0, class_weight=None, random_state=None, solver='admm', max_iter=100, multi_class='ovr', verbose=0, warm_start=False, n_jobs=1, solver_kwargs=None)¶