ray.data.block.BlockAccessor#

class ray.data.block.BlockAccessor[源代码]#

基类:object

提供特定块的访问方法。

理想情况下,我们不需要为块单独创建访问器类。然而,如果我们希望支持将 pyarrow.Table 直接存储为顶级 Ray 对象,而不需要包装类(问题 #17186),这就需要了。

开发者API: 此API可能会在Ray的次要版本之间发生变化。

方法

__init__

aggregate_combined_blocks

聚合部分合并和排序的块。

batch_to_arrow_block

从面向用户的数据格式创建一个 Arrow 块。

batch_to_block

从面向用户的数据格式创建一个块。

batch_to_pandas_block

从面向用户的数据格式创建一个 Pandas 块。

block_type

返回此块的块类型。

builder

为此块类型创建一个构建器。

combine

将具有相同键的行合并到一个累加器中。

for_block

为给定的块创建一个块访问器。

get_metadata

从此块创建一个元数据对象。

iter_rows

遍历此块的行。

merge_sorted_blocks

返回一个通过合并排序块列表排序的块。

num_rows

返回此块中包含的行数。

random_shuffle

随机打乱此块。

sample

从此块中返回一个随机样本项。

schema

返回此块的 Python 类型或 pyarrow 模式。

select

返回一个包含所提供列的新块。

size_bytes

返回此块的近似字节大小。

slice

返回此块的一个切片。

sort_and_partition

返回此块的排序分区列表。

take

返回一个包含所提供行索引的新块。

to_arrow

将此块转换为 Arrow 表格。

to_batch_format

将此块转换为提供的批处理格式。

to_block

返回此访问器包装的基础块。

to_default

返回此访问器的默认数据格式。

to_numpy

将此块(或块的列)转换为 NumPy ndarray。

to_pandas

将此块转换为 Pandas 数据框。

zip

将此块与相同类型和大小的另一块进行压缩。