dask.dataframe.DataFrame.random_split
dask.dataframe.DataFrame.random_split¶
- DataFrame.random_split(frac, random_state=None, shuffle=False)¶
伪随机地将数据框按行分割成不同的部分
- 参数
- frac列表
应总和为一的浮点数列表。
- random_stateint 或 np.random.RandomState
如果为整数,则以此为种子创建一个新的 RandomState。否则从传入的 RandomState 中抽取。
- 洗牌bool, 默认 False
如果设置为 True,数据框在分割前会在分区内部进行洗牌。
参见
dask.DataFrame.sample
示例
50/50 分拆
>>> a, b = df.random_split([0.5, 0.5])
80/10/10 分割,一致的 random_state
>>> a, b, c = df.random_split([0.8, 0.1, 0.1], random_state=123)