scipy.stats.mstats.

spearmanr#

scipy.stats.mstats.spearmanr(x, y=None, use_ties=True, axis=None, nan_policy='propagate', alternative='two-sided')[源代码][源代码]#

计算斯皮尔曼等级相关系数和用于检验非相关的p值。

Spearman 相关性是一种非参数的线性关系度量方法,用于两个数据集之间。与 Pearson 相关性不同,Spearman 相关性不假设两个数据集都是正态分布的。与其他相关系数一样,该系数在 -1 到 +1 之间变化,0 表示没有相关性。相关性为 -1 或 +1 表示单调关系。正相关表示随着 x 增加,y 也增加。负相关表示随着 x 增加,y 减少。

缺失值是成对丢弃的:如果 x 中存在缺失值,y 中对应的值将被屏蔽。

p值大致表示一个不相关的系统产生数据集的概率,这些数据集的Spearman相关性至少与从这些数据集中计算出的相关性一样极端。p值并不完全可靠,但对于大于500左右的数据集来说,可能是合理的。

参数:
x, y1D 或 2D 数组类对象,y 是可选的

一个或两个包含多个变量和观测值的1-D或2-D数组。当这些是1-D时,每个数组代表一个单一变量的观测向量。对于2-D情况下的行为,请参见下面的 axis

use_tiesbool, 可选

请勿使用。不做任何事情,关键词仅出于向后兼容的原因保留。

int 或 None, 可选

如果 axis=0(默认),则每一列代表一个变量,行中包含观测值。如果 axis=1,关系将被转置:每一行代表一个变量,而列中包含观测值。如果 axis=None,则两个数组都将被展平。

nan_policy{‘propagate’, ‘raise’, ‘omit’}, 可选

定义当输入包含 nan 时的处理方式。’propagate’ 返回 nan,’raise’ 抛出错误,’omit’ 忽略 nan 值进行计算。默认是 ‘propagate’。

替代方案{‘双侧’, ‘小于’, ‘大于’}, 可选

定义备择假设。默认是’双侧’。以下选项可用:

  • ‘双边’: 相关性非零

  • ‘less’: 相关性为负(小于零)

  • ‘greater’: 相关性为正(大于零)

Added in version 1.7.0.

返回:
res重要性结果

一个包含属性的对象:

统计浮点数或ndarray(2维方阵)

Spearman 相关矩阵或相关系数(如果仅给出两个变量作为参数)。相关矩阵是方形的,其长度等于 ab 中变量总数(列或行)。

p值浮动

假设检验的p值,其零假设是两组数据线性不相关。关于备择假设,请参见上文的 alternativepvaluestatistic 具有相同的形状。

参考文献

[CRCProbStat2000] 第14.7节