dask_expr._collection.Index.random_split

dask_expr._collection.Index.random_split

Index.random_split(frac, random_state=None, shuffle=False)

伪随机地将数据框按行分割成不同的部分

参数
frac列表

应总和为一的浮点数列表。

random_stateint 或 np.random.RandomState

如果为 int 或 None,则使用此值作为种子创建一个新的 RandomState。否则从传入的 RandomState 中抽取。

洗牌bool, 默认 False

如果设置为 True,数据框在分割前会在分区内部进行洗牌。

参见

dask.DataFrame.sample

示例

50/50 分拆

>>> a, b = df.random_split([0.5, 0.5])  

80/10/10 分割,一致的 random_state

>>> a, b, c = df.random_split([0.8, 0.1, 0.1], random_state=123)