dask.dataframe.Series.str.count

dask.dataframe.Series.str.count

dataframe.Series.str.count(pat, flags: int = 0)

计算 Series/Index 中每个字符串中模式的出现次数。

此文档字符串是从 pandas.core.strings.accessor.StringMethods.count 复制过来的。

Dask 版本可能存在一些不一致性。

此函数用于计算 Series 中每个字符串元素中特定正则表达式模式重复的次数。

参数
patstr

有效的正则表达式。

标志int, 默认值为 0, 表示无标志

re 模块的标志。完整列表请 参见此处

**kwargs

为了与其他字符串方法兼容。未使用。

返回
系列或索引

与调用对象类型相同,包含整数计数。

参见

re

用于正则表达式的标准库模块。

str.count

标准库版本,不支持正则表达式。

注释

在传递 pat 时,某些字符需要进行转义。例如,'$' 在正则表达式中有特殊含义,在查找此字面字符时必须进行转义。

示例

>>> s = pd.Series(['A', 'B', 'Aaba', 'Baca', np.nan, 'CABA', 'cat'])  
>>> s.str.count('a')  
0    0.0
1    0.0
2    2.0
3    2.0
4    NaN
5    0.0
6    1.0
dtype: float64

转义 '$' 以查找字面美元符号。

>>> s = pd.Series(['$', 'B', 'Aab$', '$$ca', 'C$B$', 'cat'])  
>>> s.str.count('\\$')  
0    1
1    0
2    1
3    2
4    2
5    0
dtype: int64

这在索引页上也可用

>>> pd.Index(['A', 'A', 'Aaba', 'cat']).str.count('a')  
Index([0, 0, 2, 1], dtype='int64')