ray.data.from_pandas_refs#

ray.data.from_pandas_refs(dfs: ObjectRef[pandas.DataFrame] | List[ObjectRef[pandas.DataFrame]]) MaterializedDataset[源代码]#

从Ray对象引用列表创建一个 Dataset 到pandas数据框。

示例

>>> import pandas as pd
>>> import ray
>>> df_ref = ray.put(pd.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]}))
>>> ray.data.from_pandas_refs(df_ref)
MaterializedDataset(num_blocks=1, num_rows=3, schema={a: int64, b: int64})

从 Pandas DataFrames 列表引用创建 Ray 数据集。

>>> ray.data.from_pandas_refs([df_ref, df_ref])
MaterializedDataset(num_blocks=2, num_rows=6, schema={a: int64, b: int64})
参数:

dfs – 一个指向 pandas dataframe 的 Ray 对象引用,或一个指向 pandas dataframes 的 Ray 对象引用列表。

返回:

Dataset 持有从数据框中读取的数据。

开发者API: 此API可能会在Ray的次要版本之间发生变化。