dask.dataframe.DataFrame.sum

dask.dataframe.DataFrame.sum

DataFrame.sum(axis=None, skipna=True, split_every=False, dtype=None, out=None, min_count=None, numeric_only=None)

返回请求轴上值的总和。

此文档字符串是从 pandas.core.frame.DataFrame.sum 复制的。

Dask 版本可能存在一些不一致性。

这等同于 numpy.sum 方法。

参数
{索引 (0), 列 (1)}

要应用函数的轴。对于 Series,此参数未使用并默认为 0。

警告

使用 axis=None 的 DataFrame.sum 行为已被弃用,在未来的版本中,这将同时对两个轴进行缩减并返回一个标量。要保留旧的行为,请传递 axis=0(或不传递 axis)。

2.0.0 新版功能.

skipnabool, 默认 True

计算结果时排除NA/空值。

仅数值bool, 默认 False

仅包含浮点数、整数、布尔类型的列。对 Series 尚未实现。

min_countint, 默认值为 0

执行操作所需的有效值数量。如果非NA值的数量少于 min_count ,结果将为NA。

**kwargs

传递给函数的额外关键字参数。

返回
序列或标量

参见

Series.sum

返回总和。

Series.min

返回最小值。

Series.max

返回最大值。

Series.idxmin

返回最小值的索引。

Series.idxmax

返回最大值的索引。

DataFrame.sum

返回请求轴上的总和。

DataFrame.min

返回请求轴上的最小值。

DataFrame.max

返回指定轴上的最大值。

DataFrame.idxmin

返回请求轴上的最小值的索引。

DataFrame.idxmax

返回请求轴上的最大值的索引。

示例

>>> idx = pd.MultiIndex.from_arrays([  
...     ['warm', 'warm', 'cold', 'cold'],
...     ['dog', 'falcon', 'fish', 'spider']],
...     names=['blooded', 'animal'])
>>> s = pd.Series([4, 2, 0, 8], name='legs', index=idx)  
>>> s  
blooded  animal
warm     dog       4
         falcon    2
cold     fish      0
         spider    8
Name: legs, dtype: int64
>>> s.sum()  
14

默认情况下,空或全为NA的Series的总和是 0

>>> pd.Series([], dtype="float64").sum()  # min_count=0 is the default  
0.0

这可以通过 min_count 参数来控制。例如,如果你希望空系列的和为 NaN,传递 min_count=1

>>> pd.Series([], dtype="float64").sum(min_count=1)  
nan

由于 skipna 参数的存在,min_count 对所有NA和空系列的处理方式相同。

>>> pd.Series([np.nan]).sum()  
0.0
>>> pd.Series([np.nan]).sum(min_count=1)  
nan