dask.dataframe.DataFrame.sample
dask.dataframe.DataFrame.sample¶
- DataFrame.sample(n=None, frac=None, replace=False, random_state=None)¶
随机样本项
- 参数
- nint, 可选
dask 不支持返回的项目数量。请改用 frac。
- fracfloat, 可选
返回项目的近似比例。此采样比例均匀应用于所有分区。请注意,这是一个 近似比例。你不应期望返回的项目数恰好为
len(df) * frac
,因为所选元素的确切数量将取决于数据的分区方式(但在实践中应该非常接近)。- 替换布尔值,可选
采样时是否替换。默认 = False。
- random_state : int 或
np.random.RandomState
整数或 如果是一个整数,我们用这个作为种子创建一个新的 RandomState;否则我们从传入的 RandomState 中抽取。