dask.array.random.f
dask.array.random.f¶
- dask.array.random.f(*args, **kwargs)¶
从 F 分布中抽取样本。
此文档字符串是从 numpy.random.mtrand.RandomState.f 复制的。
Dask 版本可能存在一些不一致性。
样本是从具有指定参数的 F 分布中抽取的,`dfnum`(分子自由度)和 `dfden`(分母自由度),其中两个参数都必须大于零。
F 分布(也称为 Fisher 分布)的随机变量是一个连续概率分布,出现在方差分析测试中,并且是两个卡方变量的比率。
备注
新代码应使用 ~numpy.random.Generator 实例的 ~numpy.random.Generator.f 方法;请参阅 随机数快速入门。
- 参数
- dfnum浮点数或浮点数的类数组对象
分子自由度,必须大于0。
- dfden浮点数或浮点数数组
分母中的自由度,必须大于0。
- 大小int 或 int 的元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k)
,那么会抽取m * n * k
个样本。如果 size 是None``(默认),当 ``dfnum
和dfden
都是标量时,返回一个单一值。否则,会抽取np.broadcast(dfnum, dfden).size
个样本。
- 返回
- 出ndarray 或标量
从参数化的费舍尔分布中抽取样本。
参见
scipy.stats.f
概率密度函数、分布或累积密度函数等。
random.Generator.f
应用于新代码。
注释
F统计量用于比较组内方差与组间方差。计算分布取决于抽样,因此它是问题中各自自由度的函数。变量 dfnum 是样本数减一,即组间自由度,而 dfden 是组内自由度,即每个组中样本数之和减去组数。
参考文献
- 1
Glantz, Stanton A. “生物统计学入门。”, McGraw-Hill, 第五版, 2002.
- 2
Wikipedia, “F-分布”, https://en.wikipedia.org/wiki/F-distribution
示例
来自Glantz[1],第47-40页的一个例子:
两组,糖尿病患者的子女(25人)和无糖尿病人士的子女(25名对照者)。测量了空腹血糖,病例组的平均值为86.1,对照组的平均值为82.2。标准差分别为2.09和2.49。这些数据是否与零假设一致,即父母的糖尿病状态不影响其子女的血糖水平?从数据中计算出的F统计值为36.01。
从分布中抽取样本:
>>> dfnum = 1. # between group degrees of freedom >>> dfden = 48. # within groups degrees of freedom >>> s = np.random.f(dfnum, dfden, 1000)
样本中前1%的下限是:
>>> np.sort(s)[-10] 7.61988120985 # random
因此,F统计量超过7.62的概率约为1%,而测得值为36,因此在1%的水平上拒绝原假设。