numpy.polynomial.polynomial.polyfit#

polynomial.polynomial.polyfit(x, y, deg, rcond=None, full=False, w=None)[源代码]#

多项式对数据的拟合.

返回一个次数为 deg 的多项式的系数,该多项式是通过最小二乘法拟合给定点 x 处的数据值 y 得到的.如果 y 是 1 维的,返回的系数也将是 1 维的.如果 y 是 2 维的,则进行多次拟合,每次拟合 y 的每一列,结果系数存储在 2 维返回值的相应列中.拟合的多项式形式为

\[p(x) = c_0 + c_1 * x + ... + c_n * x^n,\]

其中 ndeg.

参数:
x : array_like, 形状 (M,)array_like, 形状 (

M 样本(数据)点 (x[i], y[i]) 的 x 坐标.

y : array_like, 形状 (M,) 或 (M, K)array_like, 形状 (

样本点的 y 坐标.可以通过在一次调用 polyfit 时传递一个包含每列一个数据集的二维数组给 y,来对共享相同 x 坐标的几个样本点集(独立地)进行拟合.

deg整数或1-D数组类

拟合多项式的度数.如果 deg 是一个单一整数,则包括直到并包括第 deg 项的所有项.对于 NumPy 版本 >= 1.11.0,可以使用指定要包括的项的度数的整数列表.

rcondfloat, 可选

拟合的相对条件数.小于 rcond 的奇异值,相对于最大奇异值,将被忽略.默认值是 len(x)*eps,其中 eps 是平台浮点类型的相对精度,大多数情况下约为 2e-16.

fullbool, 可选

确定返回值性质的开关.当 False (默认)时,只返回系数;当 True 时,来自奇异值分解(用于解决拟合矩阵方程)的诊断信息也会返回.

w : array_like, 形状 (M,), 可选array_like, 形状 (

权重.如果不是 None,权重 w[i] 适用于在 x[i] 处的未平方残差 y[i] - y_hat[i].理想情况下,权重的选择应使得产品 w[i]*y[i] 的误差都具有相同的方差.使用逆方差加权时,使用 w[i] = 1/sigma(y[i]).默认值是 None.

在 1.5.0 版本加入.

返回:
coef : ndarray, 形状 (deg + 1,) 或 (deg + 1, K)ndarray, 形状 (

多项式系数从低到高排序.如果 y 是二维的,`coef` 列 k 中的系数表示对 y 的第 k 列数据进行多项式拟合.

[残差, 秩, 奇异值, rcond]列表

只有在 full == True 时,这些值才会被返回.

  • 残差 – 最小二乘拟合的残差平方和

  • rank – 缩放范德蒙矩阵的数值秩

  • singular_values – 缩放范德蒙矩阵的奇异值

  • rcond – rcond 的值.

更多详情,请参见 numpy.linalg.lstsq.

引发:
RankWarning

如果在最小二乘拟合中的矩阵是秩亏的,则会引发此警告.仅当 full == False 时才会引发警告.可以通过以下方式关闭警告:

>>> import warnings
>>> warnings.simplefilter('ignore', np.exceptions.RankWarning)

备注

解决方案是多项式 p 的系数,这些系数使加权平方误差的总和最小化.

\[E = \sum_j w_j^2 * |y_j - p(x_j)|^2,\]

其中 \(w_j\) 是权重.这个问题通过建立(通常)超定的矩阵方程来解决:

\[V(x) * c = w * y,\]

其中 Vx 的加权伪范德蒙矩阵,`c` 是要解的系数,`w` 是权重,`y` 是观测值.然后使用 V 的奇异值分解来解这个方程.

如果 V 的某些奇异值非常小以至于被忽略(并且 full == False),将会引发 RankWarning.这意味着系数值可能确定得很差.拟合到较低阶的多项式通常会消除警告(但这可能不是你想要的,当然;如果你有独立的原因选择这个不起作用的阶数,你可能需要:a) 重新考虑这些原因,和/或 b) 重新考虑你的数据质量).`rcond` 参数也可以设置为比其默认值更小的值,但由此产生的拟合可能是虚假的,并且由于舍入误差而有较大的贡献.

使用双精度进行多项式拟合往往在大约(多项式)20度时”失败”.使用切比雪夫或勒让德级数的拟合通常条件更好,但很大程度上仍然取决于样本点的分布和数据的平滑性.如果拟合质量不足,样条可能是很好的替代方案.

示例

>>> import numpy as np
>>> from numpy.polynomial import polynomial as P
>>> x = np.linspace(-1,1,51)  # x "data": [-1, -0.96, ..., 0.96, 1]
>>> rng = np.random.default_rng()
>>> err = rng.normal(size=len(x))
>>> y = x**3 - x + err  # x^3 - x + Gaussian noise
>>> c, stats = P.polyfit(x,y,3,full=True)
>>> c # c[0], c[1] approx. -1, c[2] should be approx. 0, c[3] approx. 1
array([ 0.23111996, -1.02785049, -0.2241444 ,  1.08405657]) # may vary
>>> stats # note the large SSR, explaining the rather poor results
[array([48.312088]),                                        # may vary
 4,
 array([1.38446749, 1.32119158, 0.50443316, 0.28853036]),
 1.1324274851176597e-14]

同样的事情,没有添加的噪音

>>> y = x**3 - x
>>> c, stats = P.polyfit(x,y,3,full=True)
>>> c # c[0], c[1] ~= -1, c[2] should be "very close to 0", c[3] ~= 1
array([-6.73496154e-17, -1.00000000e+00,  0.00000000e+00,  1.00000000e+00])
>>> stats # note the minuscule SSR
[array([8.79579319e-31]),
 np.int32(4),
 array([1.38446749, 1.32119158, 0.50443316, 0.28853036]),
 1.1324274851176597e-14]