ray.data.grouped_data.GroupedData.min#
- GroupedData.min(on: str | List[str] = None, ignore_nulls: bool = True) Dataset [源代码]#
计算分组最小值聚合。
示例
>>> import ray >>> ray.data.le(100).groupby("value").min() >>> ray.data.from_items([ ... {"A": i % 3, "B": i, "C": i**2} ... for i in range(100)]) \ ... .groupby("A") \ ... .min(["B", "C"])
- 参数:
on – 要聚合的列名或列名列表。
ignore_nulls – 是否忽略空值。如果
True
,计算最小值时将忽略空值;如果False
,遇到空值时输出将为空。我们将 np.nan、None 和 pd.NaT 视为空值。默认值为True
。
- 返回:
最小结果。对于不同的
on
值,返回结果有所不同:-on=None
:包含一个 groupby 键列"k"
的数据集,以及数据集中每个原始列的列最小值列。-on=["col_1", ..., "col_n"]
:一个包含n + 1
列的数据集,其中第一列是 groupby 键,第二列到第n + 1
列是聚合结果。如果 groupby 键为None
,则返回结果中省略键部分。