ray.data.block.BlockAccessor#
- class ray.data.block.BlockAccessor[源代码]#
基类:
object
提供特定块的访问方法。
理想情况下,我们不需要为块单独创建访问器类。然而,如果我们希望支持将
pyarrow.Table
直接存储为顶级 Ray 对象,而不需要包装类(问题 #17186),这就需要了。开发者API: 此API可能会在Ray的次要版本之间发生变化。
方法
聚合部分合并和排序的块。
从面向用户的数据格式创建一个 Arrow 块。
从面向用户的数据格式创建一个块。
从面向用户的数据格式创建一个 Pandas 块。
返回此块的块类型。
为此块类型创建一个构建器。
将具有相同键的行合并到一个累加器中。
为给定的块创建一个块访问器。
从此块创建一个元数据对象。
遍历此块的行。
返回一个通过合并排序块列表排序的块。
返回此块中包含的行数。
随机打乱此块。
从此块中返回一个随机样本项。
返回此块的 Python 类型或 pyarrow 模式。
返回一个包含所提供列的新块。
返回此块的近似字节大小。
返回此块的一个切片。
返回此块的排序分区列表。
返回一个包含所提供行索引的新块。
将此块转换为 Arrow 表格。
将此块转换为提供的批处理格式。
返回此访问器包装的基础块。
返回此访问器的默认数据格式。
将此块(或块的列)转换为 NumPy ndarray。
将此块转换为 Pandas 数据框。
将此块与相同类型和大小的另一块进行压缩。