pandas.Series.str.count #

系列.str。count ( pat , flags = 0 ) [来源] #

计算系列/索引的每个字符串中模式的出现次数。

此函数用于计算特定正则表达式模式在 .txt 文件的每个字符串元素中重复的次数 Series

参数
帕特斯特

有效的正则表达式。

flags int,默认0,表示无flags

re模块的标志。有关完整列表,请参阅此处

**夸格

为了与其他字符串方法兼容。不曾用过。

返回
系列或索引

与包含整数计数的调用对象具有相同的类型。

也可以看看

re

正则表达式的标准库模块。

str.count

标准库版本,不支持正则表达式。

笔记

传入pat时,某些字符需要转义。例如。'$'在正则表达式中具有特殊含义,在查找此文字字符时必须转义。

例子

>>> s = pd.Series(['A', 'B', 'Aaba', 'Baca', np.nan, 'CABA', 'cat'])
>>> s.str.count('a')
0    0.0
1    0.0
2    2.0
3    2.0
4    NaN
5    0.0
6    1.0
dtype: float64

逃脱'$'寻找字面的美元符号。

>>> s = pd.Series(['$', 'B', 'Aab$', '$$ca', 'C$B$', 'cat'])
>>> s.str.count('\\$')
0    1
1    0
2    1
3    2
4    2
5    0
dtype: int64

这也可以在索引上找到

>>> pd.Index(['A', 'A', 'Aaba', 'cat']).str.count('a')
Index([0, 0, 2, 1], dtype='int64')