dask.dataframe.DataFrame.sample

dask.dataframe.DataFrame.sample

DataFrame.sample(n=None, frac=None, replace=False, random_state=None)

随机样本项

参数
nint, 可选

dask 不支持返回的项目数量。请改用 frac。

fracfloat, 可选

返回项目的近似比例。此采样比例均匀应用于所有分区。请注意,这是一个 近似比例。你不应期望返回的项目数恰好为 len(df) * frac,因为所选元素的确切数量将取决于数据的分区方式(但在实践中应该非常接近)。

替换布尔值,可选

采样时是否替换。默认 = False。

random_state : int 或 np.random.RandomState整数或

如果是一个整数,我们用这个作为种子创建一个新的 RandomState;否则我们从传入的 RandomState 中抽取。