ray.data.grouped_data.GroupedData.mean#

GroupedData.mean(on: str | List[str] = None, ignore_nulls: bool = True) → Dataset[源代码]#

计算分组均值聚合。

示例

>>> import ray
>>> ray.data.le(100).groupby("value").mean() 
>>> ray.data.from_items([ 
...     {"A": i % 3, "B": i, "C": i**2} 
...     for i in range(100)]) \ 
...     .groupby("A") \ 
...     .mean(["B", "C"]) 

参数:

on – 要聚合的列名或列名列表。
ignore_nulls – 是否忽略空值。如果 True，在计算平均值时将忽略空值；如果 False，如果遇到空值，输出将为空。我们将 np.nan、None 和 pd.NaT 视为空值。默认值为 True。

返回:

平均结果。对于不同的 on 值，返回结果有所不同：- on=None：包含一个 groupby 键列 "k" 的数据集，以及数据集中每个原始列的列平均值列。- on=["col_1", ..., "col_n"]：一个包含 n + 1 列的数据集，其中第一列是 groupby 键，第二列到第 n + 1 列是聚合结果。如果 groupby 键为 None，则返回结果中省略键部分。