文章/答案/技术大牛

发布

社区首页 >问答首页 >如何在熊猫dataframe列中删除数字值之前的字符串？

问如何在熊猫dataframe列中删除数字值之前的字符串？
EN

Stack Overflow用户

提问于 2018-04-10 20:04:13

回答 2查看 957关注 0票数 2

我有一个包含字符串的熊猫数据栏，如下所示：

Column A

text moretext 251 St. Louis Apt.54
123 Orange Drive
sometext somemoretext 171 Poplar street
textnew 11th street 
77 yorkshire avenue

我希望删除数字值之前的文本，即，我希望输出如下所示：

Column A

251 St. Louis Apt.54
123 Orange Drive
171 Poplar street
11th street 
77 yorkshire avenue

python

string

pandas

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-04-10 20:07:45

让我们使用regex和extract

df['Column A'] = df['Column A'].str.extract(r'(\d+.+$)')

输出：

0    251 St. Louis Apt.54
1        123 Orange Drive
2       171 Poplar street
3             11th street
4     77 yorkshire avenue
Name: Column A, dtype: object

regex状态得到一组字符，以任意长度开始，然后继续到行尾。

票数 5

Stack Overflow用户

发布于 2018-04-10 20:12:27

此函数是查找字符串中第一个数字字符的索引，并选择字符串的其余部分。然后使用apply函数将该函数应用于列的每个值。

def change(string):
    for i, c in enumerate(string):
         if c.isdigit():
            idx = i
            break
    return string[idx:]

data[A] = data[A].apply(change, axis = 0)

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/49762063

复制

相似问题

问如何在熊猫dataframe列中删除数字值之前的字符串？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在熊猫dataframe列中删除数字值之前的字符串？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在熊猫dataframe列中删除数字值之前的字符串？
EN