Ray 数据 API# 输入/输出 合成数据 Python 对象 Parquet CSV JSON 文本 Avro 图像 二进制 TFRecords Pandas NumPy 箭头 MongoDB BigQuery SQL 数据库 Databricks Delta 共享 冰山 Lance Dask Spark Modin 火星 Torch Hugging Face TensorFlow WebDataset 数据源 API Datasink API 分区 API MetadataProvider API 数据集 API 数据集 基本变换 消费数据 执行 分组和全局聚合 I/O 和转换 检查元数据 排序、洗牌和重新分区 拆分与合并数据集 Schema 开发者 API DataIterator API 数据迭代器 ExecutionOptions API 构造函数 资源选项 GroupedData API 计算或描述性统计 函数应用 AggregateFn 全局配置 DataContext 工具 预处理器 预处理器接口 通用预处理器 分类编码器 特征缩放器 K-Bins 离散器 来自其他数据图书馆用户的API指南 对于Pandas用户 对于 PyArrow 用户 对于 PyTorch 数据集和数据加载器的用户