ray.data.datasource.行文件数据接收器.__init__#

RowBasedFileDatasink.__init__(path: str, *, filesystem: pyarrow.fs.FileSystem | None = None, try_create_dir: bool = True, open_stream_args: Dict[str, Any] | None = None, filename_provider: FilenameProvider | None = None, dataset_uuid: str | None = None, file_format: str | None = None)#

初始化此数据接收器。

参数:
  • path – 要写入文件的文件夹。

  • filesystem – 要写入文件的文件系统。如果未提供,则从路径推断文件系统。

  • try_create_dir – 是否创建目录以写入文件。

  • open_stream_args – 传递给 filesystem.open_output_stream 的参数。

  • filename_provider – 一个 ray.data.datasource.FilenameProvider,为每一行或每一块生成文件名。

  • dataset_uuid – 正在写入的数据集的UUID。如果指定,它将包含在文件名中。

  • file_format – 文件扩展名。如果指定,文件将以此扩展名写入。