dask.dataframe.Index.sum
dask.dataframe.Index.sum¶
- Index.sum(axis=None, skipna=True, split_every=False, dtype=None, out=None, min_count=None, numeric_only=None)¶
返回请求轴上值的总和。
此文档字符串是从 pandas.core.frame.DataFrame.sum 复制的。
Dask 版本可能存在一些不一致性。
这等同于
numpy.sum
方法。- 参数
- 轴{索引 (0), 列 (1)}
要应用函数的轴。对于 Series,此参数未使用并默认为 0。
警告
使用
axis=None
的 DataFrame.sum 行为已被弃用,在未来的版本中,这将同时对两个轴进行缩减并返回一个标量。要保留旧的行为,请传递 axis=0(或不传递 axis)。2.0.0 新版功能.
- skipnabool, 默认 True
计算结果时排除NA/空值。
- 仅数值bool, 默认 False
仅包含浮点数、整数、布尔类型的列。对 Series 尚未实现。
- min_countint, 默认值为 0
执行操作所需的有效值数量。如果非NA值的数量少于
min_count
,结果将为NA。- **kwargs
传递给函数的额外关键字参数。
- 返回
- 序列或标量
参见
Series.sum
返回总和。
Series.min
返回最小值。
Series.max
返回最大值。
Series.idxmin
返回最小值的索引。
Series.idxmax
返回最大值的索引。
DataFrame.sum
返回请求轴上的总和。
DataFrame.min
返回请求轴上的最小值。
DataFrame.max
返回指定轴上的最大值。
DataFrame.idxmin
返回请求轴上的最小值的索引。
DataFrame.idxmax
返回请求轴上的最大值的索引。
示例
>>> idx = pd.MultiIndex.from_arrays([ ... ['warm', 'warm', 'cold', 'cold'], ... ['dog', 'falcon', 'fish', 'spider']], ... names=['blooded', 'animal']) >>> s = pd.Series([4, 2, 0, 8], name='legs', index=idx) >>> s blooded animal warm dog 4 falcon 2 cold fish 0 spider 8 Name: legs, dtype: int64
>>> s.sum() 14
默认情况下,空或全为NA的Series的总和是
0
。>>> pd.Series([], dtype="float64").sum() # min_count=0 is the default 0.0
这可以通过
min_count
参数来控制。例如,如果你希望空系列的和为 NaN,传递min_count=1
。>>> pd.Series([], dtype="float64").sum(min_count=1) nan
由于
skipna
参数的存在,min_count
对所有NA和空系列的处理方式相同。>>> pd.Series([np.nan]).sum() 0.0
>>> pd.Series([np.nan]).sum(min_count=1) nan