dask.array.random.f

dask.array.random.f¶

dask.array.random.f(*args, **kwargs)¶

从 F 分布中抽取样本。

此文档字符串是从 numpy.random.mtrand.RandomState.f 复制的。

Dask 版本可能存在一些不一致性。

样本是从具有指定参数的 F 分布中抽取的，`dfnum`（分子自由度）和 `dfden`（分母自由度），其中两个参数都必须大于零。

F 分布（也称为 Fisher 分布）的随机变量是一个连续概率分布，出现在方差分析测试中，并且是两个卡方变量的比率。

备注

新代码应使用 ~numpy.random.Generator 实例的 ~numpy.random.Generator.f 方法；请参阅随机数快速入门。

参数

dfnum浮点数或浮点数的类数组对象: 分子自由度，必须大于0。
dfden浮点数或浮点数数组: 分母中的自由度，必须大于0。
大小int 或 int 的元组，可选: 输出形状。如果给定的形状是，例如，(m, n, k)，那么会抽取 m * n * k 个样本。如果 size 是 None``（默认），当 ``dfnum 和 dfden 都是标量时，返回一个单一值。否则，会抽取 np.broadcast(dfnum, dfden).size 个样本。

返回

参见

注释

F统计量用于比较组内方差与组间方差。计算分布取决于抽样，因此它是问题中各自自由度的函数。变量 dfnum 是样本数减一，即组间自由度，而 dfden 是组内自由度，即每个组中样本数之和减去组数。

参考文献

示例

来自Glantz[1]，第47-40页的一个例子：

两组，糖尿病患者的子女（25人）和无糖尿病人士的子女（25名对照者）。测量了空腹血糖，病例组的平均值为86.1，对照组的平均值为82.2。标准差分别为2.09和2.49。这些数据是否与零假设一致，即父母的糖尿病状态不影响其子女的血糖水平？从数据中计算出的F统计值为36.01。

从分布中抽取样本：

>>> dfnum = 1. # between group degrees of freedom  
>>> dfden = 48. # within groups degrees of freedom  
>>> s = np.random.f(dfnum, dfden, 1000)  

样本中前1%的下限是：

>>> np.sort(s)[-10]  
7.61988120985 # random

因此，F统计量超过7.62的概率约为1%，而测得值为36，因此在1%的水平上拒绝原假设。

dask.array.random.exponential

dask.array.random.gamma