ray.data.from_pandas_refs#
- ray.data.from_pandas_refs(dfs: ObjectRef[pandas.DataFrame] | List[ObjectRef[pandas.DataFrame]]) MaterializedDataset [源代码]#
从Ray对象引用列表创建一个
Dataset
到pandas数据框。示例
>>> import pandas as pd >>> import ray >>> df_ref = ray.put(pd.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})) >>> ray.data.from_pandas_refs(df_ref) MaterializedDataset(num_blocks=1, num_rows=3, schema={a: int64, b: int64})
从 Pandas DataFrames 列表引用创建 Ray 数据集。
>>> ray.data.from_pandas_refs([df_ref, df_ref]) MaterializedDataset(num_blocks=2, num_rows=6, schema={a: int64, b: int64})
- 参数:
dfs – 一个指向 pandas dataframe 的 Ray 对象引用,或一个指向 pandas dataframes 的 Ray 对象引用列表。
- 返回:
Dataset
持有从数据框中读取的数据。
开发者API: 此API可能会在Ray的次要版本之间发生变化。