ray.data.Dataset.count#

Dataset.count() int[源代码]#

计算数据集中的行数。

对于仅读取 Parquet 文件(使用 read_parquet() 创建)的数据集,此方法读取文件元数据以高效地计算行数,而无需读取整个数据。

备注

如果此数据集包含多个读取,或者如果无法从数据源提供的元数据中确定行数,则此操作将触发对此数据集执行的惰性转换。

示例

>>> import ray
>>> ds = ray.data.range(10)
>>> ds.count()
10
返回:

数据集中的记录数量。