文章/答案/技术大牛

发布

社区首页 >问答首页 >过滤数据文件中的特殊字符

问过滤数据文件中的特殊字符
EN

Stack Overflow用户

提问于 2021-05-25 03:02:52

回答 1查看 1.6K关注 0票数 0

我有以下名为data的数据

    metrics    artists

0    0.21    ['ZhanÃ©']
2    0.14    ['Mose Allison']
3    0.87    ['水柳仙']
4    0.25    ['Shel Silverstein']

“艺术家”列的一些记录具有特殊的字符，我想用具有特殊字符的记录来制作另一个df，即如下输出：

数据：

     metrics    artists

0    0.14    ['Mose Allison']
1    0.25    ['Shel Silverstein']

data2：

     metrics    artists

0    0.21    ['ZhanÃ©']
1    0.14    ['水柳仙']

用途：

 data2=data.artists[data.artists.str.contains("[^a-zA-Z0-9]")]

但我得到了原始的df

我也尝试过：

data2 = []
for x in data['artists']:
    if x is not "[^a-zA-Z0-9 ]":
         data2[x]=data[x]
    print(data2)

但它给了我一个错误：

KeyError: "['ZhanÃ©']"

并附有：

if x is "[^ a-zA-Z0-9]"

返回空记录。

filter

special-characters

python

pandas

dataframe

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-05-25 03:19:20

使用：

data2=data.artists[data.artists.str.contains("^a-zA-Z0-9")]

但我得到了原始的df

您在"^a-zA-Z0-9“中缺少一个空格，这就是为什么要得到原始df的原因。在木星笔记本上用Python3测试。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67681201

复制

相似问题

问过滤数据文件中的特殊字符
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问过滤数据文件中的特殊字符EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问过滤数据文件中的特殊字符
EN