pandas.Series.str.partition#
- Series.str.partition(sep=' ', expand=True)[源代码]#
在 sep 的第一次出现处拆分字符串。
此方法在 sep 的第一个出现位置拆分字符串,并返回包含分隔符之前部分、分隔符本身和分隔符之后部分的3个元素。如果找不到分隔符,则返回3个元素,包含字符串本身,后跟两个空字符串。
- 参数:
- sepstr, 默认 空白
要分割的字符串。
- 展开布尔值, 默认为 True
如果为True,返回扩展维度的DataFrame/MultiIndex。如果为False,返回Series/Index。
- 返回:
- DataFrame/MultiIndex 或 Series/Index 的对象
根据 expand 参数返回适当类型,并根据 sep 参数拆分字符串。
参见
rpartition
在 sep 的最后一次出现处拆分字符串。
Series.str.split
根据给定的分隔符拆分字符串。
str.partition
标准库版本。
例子
>>> s = pd.Series(['Linda van der Berg', 'George Pitt-Rivers']) >>> s 0 Linda van der Berg 1 George Pitt-Rivers dtype: object
>>> s.str.partition() 0 1 2 0 Linda van der Berg 1 George Pitt-Rivers
要按最后一个空格而不是第一个空格进行分区:
>>> s.str.rpartition() 0 1 2 0 Linda van der Berg 1 George Pitt-Rivers
要按不同于空格的方式进行分区:
>>> s.str.partition('-') 0 1 2 0 Linda van der Berg 1 George Pitt - Rivers
要返回包含元组的系列而不是数据框:
>>> s.str.partition('-', expand=False) 0 (Linda van der Berg, , ) 1 (George Pitt, -, Rivers) dtype: object
也可在索引上使用:
>>> idx = pd.Index(['X 123', 'Y 999']) >>> idx Index(['X 123', 'Y 999'], dtype='object')
这将创建一个 MultiIndex:
>>> idx.str.partition() MultiIndex([('X', ' ', '123'), ('Y', ' ', '999')], )
或者一个带有元组的索引,使用
expand=False
:>>> idx.str.partition(expand=False) Index([('X', ' ', '123'), ('Y', ' ', '999')], dtype='object')