用户指南# 如果你是 Ray Data 的新手,请从 Ray Data 快速入门 开始。本用户指南将帮助你导航 Ray Data 项目,并展示如何完成几项任务。 加载数据 读取文件 从其他库加载数据 读取数据库 创建合成数据 加载其他数据源 性能考虑 检查数据 描述数据集 检查行 检查批次 检查执行统计信息 数据转换 转换行 转换批次 有状态转换 分组和转换组 迭代数据 遍历行 批量迭代 通过打乱顺序迭代批次 为分布式并行训练拆分数据集 数据洗牌 洗牌类型 高级:优化洗牌 保存数据 将数据写入文件 将数据集转换为其他 Python 库 使用图像 读取图像 转换图像 对图像进行推理 保存图像 处理文本 读取文本文件 转换文本 对文本进行推理 保存文本 使用张量 / NumPy 张量数据表示 转换张量数据 保存张量数据 使用 PyTorch 迭代 Torch 张量进行训练 使用 Torch 张量的变换 使用 PyTorch 进行批量推理 保存包含 Torch 张量的数据集 从 PyTorch 数据集和数据加载器迁移 监控您的工作负载 Ray Data 仪表板 Ray 数据日志 Ray 数据统计 执行配置 配置 ExecutionOptions 配置 DataContext 端到端:离线批量推理 快速入门 配置与故障排除 高级:性能提示与调优 优化转换 优化读取 减少内存使用 配置执行 可重复性 高级: 读写自定义文件类型 从文件读取数据 将数据写入文件