dask.dataframe.Series.str.count
dask.dataframe.Series.str.count¶
- dataframe.Series.str.count(pat, flags: int = 0)¶
计算 Series/Index 中每个字符串中模式的出现次数。
此文档字符串是从 pandas.core.strings.accessor.StringMethods.count 复制过来的。
Dask 版本可能存在一些不一致性。
此函数用于计算
Series
中每个字符串元素中特定正则表达式模式重复的次数。- 参数
- patstr
有效的正则表达式。
- 标志int, 默认值为 0, 表示无标志
re 模块的标志。完整列表请 参见此处。
- **kwargs
为了与其他字符串方法兼容。未使用。
- 返回
- 系列或索引
与调用对象类型相同,包含整数计数。
注释
在传递 pat 时,某些字符需要进行转义。例如,
'$'
在正则表达式中有特殊含义,在查找此字面字符时必须进行转义。示例
>>> s = pd.Series(['A', 'B', 'Aaba', 'Baca', np.nan, 'CABA', 'cat']) >>> s.str.count('a') 0 0.0 1 0.0 2 2.0 3 2.0 4 NaN 5 0.0 6 1.0 dtype: float64
转义
'$'
以查找字面美元符号。>>> s = pd.Series(['$', 'B', 'Aab$', '$$ca', 'C$B$', 'cat']) >>> s.str.count('\\$') 0 1 1 0 2 1 3 2 4 2 5 0 dtype: int64
这在索引页上也可用
>>> pd.Index(['A', 'A', 'Aaba', 'cat']).str.count('a') Index([0, 0, 2, 1], dtype='int64')