pandas.Series.str.count#
- Series.str.count(pat, flags=0)[源代码]#
计算 Series/Index 中每个字符串中模式的出现次数。
此函数用于计算
Series
的每个字符串元素中特定正则表达式模式重复的次数。- 参数:
- patstr
有效的正则表达式。
- 标志int, 默认 0, 表示无标志
re 模块的标志。完整列表请参见 这里。
- 返回:
- 系列或索引
与调用对象类型相同,包含整数计数。
备注
在传递 pat 时,某些字符需要进行转义。例如,
'$'
在正则表达式中具有特殊含义,在查找此字面字符时必须进行转义。示例
>>> s = pd.Series(["A", "B", "Aaba", "Baca", np.nan, "CABA", "cat"]) >>> s.str.count("a") 0 0.0 1 0.0 2 2.0 3 2.0 4 NaN 5 0.0 6 1.0 dtype: float64
转义
'$'
以找到实际的美元符号。>>> s = pd.Series(["$", "B", "Aab$", "$$ca", "C$B$", "cat"]) >>> s.str.count("\\$") 0 1 1 0 2 1 3 2 4 2 5 0 dtype: int64
这在索引上也可用
>>> pd.Index(["A", "A", "Aaba", "cat"]).str.count("a") Index([0, 0, 2, 1], dtype='int64')