ray.data.Dataset.to_pandas#
- Dataset.to_pandas(limit: int = None) pandas.DataFrame [源代码]#
将这个
Dataset
转换为一个单独的 pandas DataFrame。如果行数超过提供的
limit
,此方法会报错。要事先截断数据集,请调用limit()
。示例
>>> import ray >>> ds = ray.data.from_items([{"a": i} for i in range(3)]) >>> ds.to_pandas() a 0 0 1 1 2 2
备注
此操作将触发对此数据集执行的延迟转换。
时间复杂度:O(数据集大小)
- 参数:
limit – 返回的最大行数。如果数据集的行数超过此限制,则会引发错误。默认为
None
,表示没有限制。- 返回:
从此数据集创建的 pandas DataFrame,包含有限数量的行。
- 抛出:
ValueError – 如果
Dataset
中的行数超过limit
。