ray.data.Datasource#

class ray.data.Datasource[源代码]#

基类:object

用于定义自定义 Dataset 数据源的接口。

要将数据源读入数据集,请使用 read_datasource()

方法

__init__

create_reader

已弃用:请实现 get_read_tasks()estimate_inmemory_data_size() 代替。

estimate_inmemory_data_size

返回内存中数据大小的估计值,如果未知则返回 None。

get_name

返回此数据源的人类可读名称。

get_read_tasks

执行读取并返回读取任务。

prepare_read

已弃用:请实现 get_read_tasks()estimate_inmemory_data_size() 代替。

属性

should_create_reader

supports_distributed_reads

如果 False ,仅在驱动节点上启动读取任务。