ray.data.datasource.行文件数据接收器.__init__#
- RowBasedFileDatasink.__init__(path: str, *, filesystem: pyarrow.fs.FileSystem | None = None, try_create_dir: bool = True, open_stream_args: Dict[str, Any] | None = None, filename_provider: FilenameProvider | None = None, dataset_uuid: str | None = None, file_format: str | None = None)#
初始化此数据接收器。
- 参数:
path – 要写入文件的文件夹。
filesystem – 要写入文件的文件系统。如果未提供,则从路径推断文件系统。
try_create_dir – 是否创建目录以写入文件。
open_stream_args – 传递给
filesystem.open_output_stream
的参数。filename_provider – 一个
ray.data.datasource.FilenameProvider
,为每一行或每一块生成文件名。dataset_uuid – 正在写入的数据集的UUID。如果指定,它将包含在文件名中。
file_format – 文件扩展名。如果指定,文件将以此扩展名写入。