ray.data.Dataset.to_pandas#

Dataset.to_pandas(limit: int = None) pandas.DataFrame[源代码]#

将这个 Dataset 转换为一个单独的 pandas DataFrame。

如果行数超过提供的 limit,此方法会报错。要事先截断数据集,请调用 limit()

示例

>>> import ray
>>> ds = ray.data.from_items([{"a": i} for i in range(3)])
>>> ds.to_pandas()
   a
0  0
1  1
2  2

备注

此操作将触发对此数据集执行的延迟转换。

时间复杂度:O(数据集大小)

参数:

limit – 返回的最大行数。如果数据集的行数超过此限制,则会引发错误。默认为 None,表示没有限制。

返回:

从此数据集创建的 pandas DataFrame,包含有限数量的行。

抛出:

ValueError – 如果 Dataset 中的行数超过 limit