ttest_rel#
- scipy.stats.ttest_rel(a, b, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)[源代码][源代码]#
计算两组相关样本分数 a 和 b 的 t 检验。
这是一个检验零假设的测试,即两个相关或重复的样本具有相同的平均(预期)值。
- 参数:
- a, barray_like
数组必须具有相同的形状。
- 轴int 或 None, 默认值: 0
如果是一个整数,表示输入数据中要计算统计量的轴。输入数据的每个轴切片(例如行)的统计量将出现在输出的相应元素中。如果为
None
,则在计算统计量之前会将输入数据展平。- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定义如何处理输入的 NaN。
propagate
: 如果在计算统计量的轴切片(例如行)中存在 NaN,则输出的相应条目将为 NaN。omit
: 在执行计算时,NaN 将被省略。如果在计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。raise
: 如果存在 NaN,将引发ValueError
。
- 替代方案{‘双侧’, ‘小于’, ‘大于’}, 可选
定义备择假设。以下选项可用(默认是’双侧’):
‘双侧’: 样本所基于的分布的均值不相等。
‘less’: 第一个样本所基于的分布的均值小于第二个样本所基于的分布的均值。
‘greater’: 第一个样本所基于的分布的均值大于第二个样本所基于的分布的均值。
Added in version 1.6.0.
- keepdimsbool, 默认值: False
如果设置为True,被减少的轴将作为尺寸为1的维度保留在结果中。通过此选项,结果将正确地与输入数组进行广播。
- 返回:
- 结果 :
TtestResult
Ttest结果 一个具有以下属性的对象:
- 统计浮点数或数组
t-统计量。
- p值浮点数或数组
与给定备择假设相关的p值。
- df浮点数或数组
用于计算 t 统计量的自由度数;这比样本大小少一个 (
a.shape[axis]
)。Added in version 1.10.0.
该对象还具有以下方法:
- confidence_interval(confidence_level=0.95)
计算给定置信水平下总体均值差异的置信区间。置信区间以
namedtuple
形式返回,包含 low 和 high 字段。Added in version 1.10.0.
- 结果 :
注释
使用示例包括同一组学生在不同考试中的分数,或从同一单位进行的重复抽样。该测试衡量的是平均分数在样本(例如考试)之间是否存在显著差异。如果我们观察到一个较大的p值,例如大于0.05或0.1,那么我们无法拒绝平均分数相同的零假设。如果p值小于阈值,例如1%、5%或10%,那么我们拒绝平均分数相等的零假设。较小的p值与较大的t统计量相关。
t统计量计算为
np.mean(a - b)/se
,其中se
是标准误差。因此,当a - b
的样本均值大于零时,t统计量为正;当a - b
的样本均值小于零时,t统计量为负。从 SciPy 1.9 开始,
np.matrix
输入(不推荐用于新代码)在计算执行前被转换为np.ndarray
。在这种情况下,输出将是一个标量或适当形状的np.ndarray
,而不是一个 2D 的np.matrix
。同样,虽然掩码数组的掩码元素被忽略,但输出将是一个标量或np.ndarray
,而不是一个mask=False
的掩码数组。参考文献
https://en.wikipedia.org/wiki/T-test#Dependent_t-test_for_paired_samples
示例
>>> import numpy as np >>> from scipy import stats >>> rng = np.random.default_rng()
>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng) >>> rvs2 = (stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng) ... + stats.norm.rvs(scale=0.2, size=500, random_state=rng)) >>> stats.ttest_rel(rvs1, rvs2) TtestResult(statistic=-0.4549717054410304, pvalue=0.6493274702088672, df=499) >>> rvs3 = (stats.norm.rvs(loc=8, scale=10, size=500, random_state=rng) ... + stats.norm.rvs(scale=0.2, size=500, random_state=rng)) >>> stats.ttest_rel(rvs1, rvs3) TtestResult(statistic=-5.879467544540889, pvalue=7.540777129099917e-09, df=499)