ray.data.Dataset.to_arrow_refs#
- Dataset.to_arrow_refs() List[ObjectRef[pyarrow.Table]] [源代码]#
将这个
Dataset
转换为一组分布式的 PyArrow 表。对于此数据集中的每个块,都会创建一个 PyArrow 表。
此方法仅支持可转换为 PyArrow 表的数据集。如果现有数据已经是 PyArrow 格式,则此函数是零拷贝的。否则,数据将被转换为 PyArrow 格式。
示例
>>> import ray >>> ds = ray.data.range(10, override_num_blocks=2) >>> refs = ds.to_arrow_refs() >>> len(refs) 2
备注
此操作将触发对此数据集执行的延迟转换。
时间复杂度:O(1),除非需要转换。
- 返回:
从此数据集创建的远程 PyArrow 表的列表。
开发者API: 此API可能会在Ray的次要版本之间发生变化。