numpy.polynomial.legendre.legfit#

polynomial.legendre.legfit(x, y, deg, rcond=None, full=False, w=None)[源代码]#

最小二乘法拟合勒让德级数到数据.

返回一个勒让德级数的系数,该级数的次数为 deg,是拟合数据值 y 在点 x 上的最小二乘拟合.如果 y 是 1 维的,返回的系数也将是 1 维的.如果 y 是 2 维的,则进行多次拟合,每次拟合 y 的每一列,结果系数存储在 2 维返回值的相应列中.拟合的多项式形式为

\[p(x) = c_0 + c_1 * L_1(x) + ... + c_n * L_n(x),\]

其中 ndeg.

参数:
x类数组,形状 (M,)

M 个样本点的 x 坐标 (x[i], y[i]).

yarray_like, 形状 (M,) 或 (M, K)

样本点的 y 坐标.通过传入一个包含每列一个数据集的二维数组,可以同时拟合几个共享相同 x 坐标的样本点数据集.

deg整数或1-D array_like

拟合多项式的度数.如果 deg 是一个整数,则包括所有直到并包括第 deg 项的项.对于 NumPy 版本 >= 1.11.0,可以使用指定要包括的项的度数的整数列表.

rcondfloat, 可选

拟合的相对条件数.相对于最大奇异值,小于此值的奇异值将被忽略.默认值是 len(x)*eps,其中 eps 是浮点类型的相对精度,在大多数情况下约为 2e-16.

fullbool, 可选

确定返回值性质的开关.当它为 False(默认)时,仅返回系数,当为 True 时,还会返回来自奇异值分解的诊断信息.

w : array_like, 形状 (M,), 可选array_like, 形状 (

权重.如果不是 None,权重 w[i] 适用于在 x[i] 处的未平方残差 y[i] - y_hat[i].理想情况下,权重的选择应使得产品 w[i]*y[i] 的误差都具有相同的方差.使用逆方差加权时,使用 w[i] = 1/sigma(y[i]).默认值是 None.

在 1.5.0 版本加入.

返回:
coefndarray, 形状 (M,) 或 (M, K)

勒让德系数从低到高排序.如果 y 是二维的,则 y 的第 k 列数据的系数在第 k 列中.如果 deg 被指定为一个列表,则在返回的 coef 中,未包含在拟合中的项的系数设置为零.

[残差, 秩, 奇异值, rcond]列表

只有在 full == True 时,这些值才会被返回.

  • 残差 – 最小二乘拟合的残差平方和

  • rank – 缩放范德蒙矩阵的数值秩

  • singular_values – 缩放范德蒙矩阵的奇异值

  • rcond – rcond 的值.

更多详情,请参见 numpy.linalg.lstsq.

警告:
RankWarning

在最小二乘拟合中,系数矩阵的秩不足.只有在 full == False 时才会引发警告.可以通过以下方式关闭警告:

>>> import warnings
>>> warnings.simplefilter('ignore', np.exceptions.RankWarning)

参见

numpy.polynomial.polynomial.polyfit
numpy.polynomial.chebyshev.chebfit
numpy.polynomial.laguerre.lagfit
numpy.polynomial.hermite.hermfit
numpy.polynomial.hermite_e.hermefit
legval

评估一个勒让德级数.

legvander

勒让德级数的范德蒙矩阵.

legweight

勒让德权重函数 (= 1).

numpy.linalg.lstsq

从矩阵中计算最小二乘拟合.

scipy.interpolate.UnivariateSpline

计算样条拟合.

备注

解决方案是勒让德级数 p 的系数,这些系数使加权平方误差的总和最小化.

\[E = \sum_j w_j^2 * |y_j - p(x_j)|^2,\]

其中 \(w_j\) 是权重.这个问题通过建立为(通常)超定的矩阵方程来解决

\[V(x) * c = w * y,\]

其中 Vx 的加权伪范德蒙矩阵,`c` 是要解的系数,`w` 是权重,`y` 是观测值.然后使用 V 的奇异值分解来解这个方程.

如果 V 的一些奇异值非常小以至于被忽略,那么会发出一个 RankWarning .这意味着系数值可能确定得很差.使用较低阶的拟合通常可以消除警告.`rcond` 参数也可以设置为比默认值更小的值,但由此产生的拟合可能是虚假的,并且由于舍入误差而有较大的贡献.

使用勒让德级数的拟合通常比使用幂级数的拟合条件更好,但这很大程度上取决于样本点的分布和数据的平滑度.如果拟合质量不足,样条可能是更好的选择.

参考文献

[1]

Wikipedia, “曲线拟合”, https://en.wikipedia.org/wiki/Curve_fitting