dask.dataframe.DataFrame.count

dask.dataframe.DataFrame.count

DataFrame.count(axis=None, split_every=False, numeric_only=False)

计算每列或每行的非NA单元格数量。

此文档字符串是从 pandas.core.frame.DataFrame.count 复制而来的。

Dask 版本可能存在一些不一致性。

None, NaN, NaT, pandas.NA 被视为缺失值。

参数
{0 或 ‘index’, 1 或 ‘columns’}, 默认 0

如果为0或’index’,则为每一列生成计数。如果为1或’columns’,则为每一行生成计数。

仅数值bool, 默认 False

只包含 floatintboolean 数据。

返回
系列

对于每一列/行,非NA/null条目的数量。

参见

Series.count

Series 中非 NA 元素的数量。

DataFrame.value_counts

计算列的唯一组合。

DataFrame.shape

DataFrame 的行数和列数(包括 NA 元素)。

DataFrame.isna

布尔型相同大小的 DataFrame,显示 NA 元素的位置。

示例

从字典构建 DataFrame:

>>> df = pd.DataFrame({"Person":  
...                    ["John", "Myla", "Lewis", "John", "Myla"],
...                    "Age": [24., np.nan, 21., 33, 26],
...                    "Single": [False, True, True, True, False]})
>>> df  
   Person   Age  Single
0    John  24.0   False
1    Myla   NaN    True
2   Lewis  21.0    True
3    John  33.0    True
4    Myla  26.0   False

注意未统计的 NA 值:

>>> df.count()  
Person    5
Age       4
Single    5
dtype: int64

的计数:

>>> df.count(axis='columns')  
0    3
1    2
2    3
3    3
4    3
dtype: int64