ray.data.Dataset.materialize#
- Dataset.materialize() MaterializedDataset[源代码]#
执行并将此数据集物化到对象存储内存中。
备注
此操作将触发对此数据集执行的延迟转换。
这可以用来将所有块读入内存。默认情况下,Dataset 在第一次转换之前不会从数据源读取块。
请注意,这不会改变原始数据集。只有返回的 MaterializedDataset 类的块会被固定在内存中。
示例
>>> import ray >>> ds = ray.data.range(10) >>> materialized_ds = ds.materialize() >>> materialized_ds MaterializedDataset(num_blocks=..., num_rows=10, schema={id: int64})
- 返回:
一个持有物化数据块的 MaterializedDataset。