ray.data.Dataset.limit#

Dataset.limit(limit: int) Dataset[源代码]#

将数据集截断至前 limit 行。

take() 不同,此方法不会将数据移动到调用者的机器上。相反,它会返回一个指向截断后的分布式数据的新 Dataset

示例

>>> import ray
>>> ds = ray.data.range(1000)
>>> ds.limit(5).count()
5

时间复杂度: O(指定的限制)

参数:

limit – 要截断的数据集的大小。

返回:

截断的数据集。