ray.data.Dataset.materialize#

Dataset.materialize() MaterializedDataset[源代码]#

执行并将此数据集物化到对象存储内存中。

备注

此操作将触发对此数据集执行的延迟转换。

这可以用来将所有块读入内存。默认情况下,Dataset 在第一次转换之前不会从数据源读取块。

请注意,这不会改变原始数据集。只有返回的 MaterializedDataset 类的块会被固定在内存中。

示例

>>> import ray
>>> ds = ray.data.range(10)
>>> materialized_ds = ds.materialize()
>>> materialized_ds
MaterializedDataset(num_blocks=..., num_rows=10, schema={id: int64})
返回:

一个持有物化数据块的 MaterializedDataset。