我有以下名为data的数据
metrics artists
0 0.21 ['Zhané']
2 0.14 ['Mose Allison']
3 0.87 ['水柳仙']
4 0.25 ['Shel Silverstein']“艺术家”列的一些记录具有特殊的字符,我想用具有特殊字符的记录来制作另一个df,即如下输出:
数据:
metrics artists
0 0.14 ['Mose Allison']
1 0.25 ['Shel Silverstein']data2:
metrics artists
0 0.21 ['Zhané']
1 0.14 ['水柳仙']用途:
data2=data.artists[data.artists.str.contains("[^a-zA-Z0-9]")]但我得到了原始的df
我也尝试过:
data2 = []
for x in data['artists']:
if x is not "[^a-zA-Z0-9 ]":
data2[x]=data[x]
print(data2)但它给了我一个错误:
KeyError: "['Zhané']"并附有:
if x is "[^ a-zA-Z0-9]"返回空记录。
发布于 2021-05-25 03:19:20
使用:
data2=data.artists[data.artists.str.contains("^a-zA-Z0-9")]
但我得到了原始的df
您在"^a-zA-Z0-9“中缺少一个空格,这就是为什么要得到原始df的原因。在木星笔记本上用Python3测试。
https://stackoverflow.com/questions/67681201
复制相似问题