首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在Python Pandas中对数据帧使用字符串方法?

在Python Pandas中对数据帧使用字符串方法?
EN

Stack Overflow用户
提问于 2015-02-22 12:16:10
回答 1查看 395关注 0票数 1

我有一个数据帧,其字符串格式如下。

代码语言:javascript
复制
data.description[4000]=['Conduit, PVC Utility Type DB 60 TC-6, 1-1/2"                                   LF   .050   $.86   $1.90   $2.76']

字符串的大小各不相同,但我希望在‘LF’子字符串上拆分字符串。所需的输出将是

代码语言:javascript
复制
data2=['Conduit, PVC Utility Type DB 60 TC-6,1 -1/2"','LF',.050,'$.86','$1.90','$2.76]

如果我有一个单元列表

代码语言:javascript
复制
units=['CLF','LF','EA']

如何搜索dataframe字符串并以上述格式拆分该字符串?使用单元分隔符拆分似乎是可行的,但我会丢失单元。这给了我2个字符串,可以进一步拆分,但它似乎需要一个逐行函数。

有没有更好的方法来做这件事?

EN

回答 1

Stack Overflow用户

发布于 2015-02-22 12:28:07

您可以直接在包含文本的列上使用字符串方法split

代码语言:javascript
复制
df['text'].str.split('(CLF|LF|EA)')

您可以使用捕获括号来保留分隔符

示例:

代码语言:javascript
复制
units ='(CLF|LF|EA)'
df =pd.DataFrame({'text':['aaaaaaa LF bbbbbbbb','123456 CLF 78910','!!!!!!!! EA @@@@@@@@@@']})
df.text.str.split(units)

返回:

代码语言:javascript
复制
0       [aaaaaaa , LF,  bbbbbbbb]
1          [123456 , CLF,  78910]
2    [!!!!!!!! , EA,  @@@@@@@@@@]
Name: text, dtype: object
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28654481

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档