ray.data.from_arrow#

ray.data.from_arrow(tables: pyarrow.Table | bytes | List[pyarrow.Table | bytes]) MaterializedDataset[源代码]#

从 PyArrow 表的列表创建一个 Dataset

示例

>>> import pyarrow as pa
>>> import ray
>>> table = pa.table({"x": [1]})
>>> ray.data.from_arrow(table)
MaterializedDataset(num_blocks=1, num_rows=1, schema={x: int64})

从 PyArrow 表的列表创建一个 Ray 数据集。

>>> ray.data.from_arrow([table, table])
MaterializedDataset(num_blocks=2, num_rows=2, schema={x: int64})
参数:

tables – 一个 PyArrow 表,或一个 PyArrow 表的列表,或其字节流格式。

返回:

Dataset 持有来自 PyArrow 表的数据。