掩码数组的统计函数(scipy.stats.mstats#

此模块包含大量可与掩码数组一起使用的统计函数。

这些函数中的大多数与 scipy.stats 中的函数相似,但在 API 或使用的算法上可能存在细微差异。由于这是一个相对较新的包,一些 API 更改仍然是可能的。

汇总统计#

describe(a[, axis, ddof, bias])

计算传递数组的几个描述性统计数据。

gmean(a[, axis, dtype, weights, nan_policy, ...])

计算沿指定轴的加权几何平均值。

hmean(a[, axis, dtype, weights, nan_policy, ...])

计算沿指定轴的加权调和平均值。

kurtosis(a[, axis, fisher, bias])

计算数据集的峰度(Fisher 或 Pearson)。

mode(a[, axis])

返回传入数组中出现频率最高的值的数组。

mquantiles(a[, prob, alphap, betap, axis, limit])

计算数据数组的经验分位数。

hdmedian(data[, axis, var])

返回沿给定轴的Harrell-Davis中位数估计值。

hdquantiles(data[, prob, axis, var])

使用 Harrell-Davis 方法计算分位数估计。

hdquantiles_sd(data[, prob, axis])

Harrell-Davis 分位数估计的刀切法标准误差。

idealfourths(data[, axis])

返回下四分位数和上四分位数的估计值。

plotting_positions(data[, alpha, beta])

返回数据的绘图位置(或经验百分位点)。

meppf(data[, alpha, beta])

返回数据的绘图位置(或经验百分位点)。

moment(a[, moment, axis])

计算样本关于均值的第 n 阶矩。

skew(a[, axis, bias])

计算数据集的偏度。

tmean(a[, limits, inclusive, axis])

计算修剪后的均值。

tvar(a[, limits, inclusive, axis, ddof])

计算修剪后的方差

tmin(a[, lowerlimit, axis, inclusive])

计算修剪后的最小值

tmax(a[, upperlimit, axis, inclusive])

计算修剪后的最大值

tsem(a[, limits, inclusive, axis, ddof])

计算修剪后的均值标准误差。

variation(a[, axis, ddof])

计算变异系数。

find_repeats(arr)

在 arr 中查找重复项并返回一个元组 (repeats, repeat_count)。

sem(a[, axis, ddof])

计算输入数组的平均值的标准误差。

trimmed_mean(a[, limits, inclusive, ...])

返回沿给定轴的数据的修剪平均值。

trimmed_mean_ci(data[, limits, inclusive, ...])

沿给定轴的修剪均值的选定置信区间。

trimmed_std(a[, limits, inclusive, ...])

返回沿给定轴的数据的修剪标准差。

trimmed_var(a[, limits, inclusive, ...])

返回沿给定轴的数据的修剪方差。

频率统计#

scoreatpercentile(data, per[, limit, ...])

计算序列 a 在给定的 'per' 百分位数处的分数。

相关函数#

f_oneway(*args)

执行单因素方差分析,返回任意数量组的F值和概率。

pearsonr(x, y)

皮尔逊相关系数和用于检验非相关的p值。

spearmanr(x[, y, use_ties, axis, ...])

计算斯皮尔曼等级相关系数和用于检验非相关的p值。

pointbiserialr(x, y)

计算点双列相关系数及其p值。

kendalltau(x, y[, use_ties, use_missing, ...])

计算两个变量 xy 之间的 Kendall 等级相关系数 tau。

kendalltau_seasonal(x)

计算季节性数据的多变量 Kendall 秩相关系数 tau。

linregress(x[, y])

为两组测量值计算线性最小二乘回归。

siegelslopes(y[, x, method])

计算一组点 (x, y) 的 Siegel 估计量。

theilslopes(y[, x, alpha, method])

计算一组点 (x, y) 的 Theil-Sen 估计量。

sen_seasonal_slopes(x)

计算季节性 Theil-Sen 和 Kendall 斜率估计量。

统计检验#

ttest_1samp(a, popmean[, axis, alternative])

计算一组分数的均值的T检验。

ttest_onesamp(a, popmean[, axis, alternative])

计算一组分数的均值的T检验。

ttest_ind(a, b[, axis, equal_var, alternative])

计算两个独立分数样本均值的T检验。

ttest_rel(a, b[, axis, alternative])

计算两组相关分数样本 a 和 b 的 T 检验。

chisquare(f_obs[, f_exp, ddof, axis])

计算单向卡方检验。

kstest(data1, data2[, args, alternative, method])

ks_2samp(data1, data2[, alternative, method])

计算两个样本的 Kolmogorov-Smirnov 检验。

ks_1samp(x, cdf[, args, alternative, method])

计算掩码值单样本的 Kolmogorov-Smirnov 检验。

ks_twosamp(data1, data2[, alternative, method])

计算两个样本的 Kolmogorov-Smirnov 检验。

mannwhitneyu(x, y[, use_continuity])

计算Mann-Whitney统计量

rankdata(data[, axis, use_missing])

返回沿给定轴的每个数据点的秩(也称为顺序统计量)。

kruskal(*args)

计算独立样本的Kruskal-Wallis H检验

kruskalwallis(*args)

计算独立样本的Kruskal-Wallis H检验

friedmanchisquare(*args)

Friedman 卡方检验是一种非参数的、单因素受试者内方差分析。

brunnermunzel(x, y[, alternative, distribution])

计算样本 x 和 y 上的 Brunner-Munzel 检验。

skewtest(a[, axis, alternative])

测试偏度是否与正态分布不同。

kurtosistest(a[, axis, alternative])

测试数据集是否具有正态峰度

normaltest(a[, axis])

测试样本是否与正态分布不同。

变换#

obrientransform(*args)

对输入数据(任意数量的列)进行变换计算。

trim(a[, limits, inclusive, relative, axis])

通过屏蔽超出给定范围的数据来修剪数组。

trima(a[, limits, inclusive])

通过屏蔽超出给定范围的数据来修剪数组。

trimmed_stde(a[, limits, inclusive, axis])

返回沿给定轴的修剪平均值的标准误差。

trimr(a[, limits, inclusive, axis])

通过在每一端屏蔽一定比例的数据来修剪数组。

trimtail(data[, proportiontocut, tail, ...])

通过从一个尾部掩码值来修剪数据。

trimboth(data[, proportiontocut, inclusive, ...])

去除最小和最大的数据值。

winsorize(a[, limits, inclusive, inplace, ...])

返回输入数组的Winsorized版本。

zmap(scores, compare[, axis, ddof, nan_policy])

计算相对z分数。

zscore(a[, axis, ddof, nan_policy])

计算 z 分数。

其他#

argstoarray(*args)

从一组序列构建一个二维数组。

count_tied_groups(x[, use_missing])

计算平局值的数量。

msign(x)

返回 x 的符号,如果 x 被掩码则返回 0。

compare_medians_ms(group_1, group_2[, axis])

比较两个独立组在给定轴上的中位数。

median_cihs(data[, alpha, axis])

计算数据中位数的alpha水平置信区间。

mjci(data[, prob, axis])

返回数据中选定实验分位数的标准误差的Maritz-Jarrett估计值。

mquantiles_cimj(data[, prob, alpha, axis])

计算数据的选定分位数的alpha置信区间,使用Maritz-Jarrett估计量。

rsh(data[, points])

评估每个数据点的Rosenblatt移位直方图估计器。