ray.data.Dataset.count#
- Dataset.count() int [源代码]#
计算数据集中的行数。
对于仅读取 Parquet 文件(使用
read_parquet()
创建)的数据集,此方法读取文件元数据以高效地计算行数,而无需读取整个数据。备注
如果此数据集包含多个读取,或者如果无法从数据源提供的元数据中确定行数,则此操作将触发对此数据集执行的惰性转换。
示例
>>> import ray >>> ds = ray.data.range(10) >>> ds.count() 10
- 返回:
数据集中的记录数量。