如何在python中像这样从字典中删除不需要的字符(\U20)?
[{'title': 'title1',
'tags': ['data mining\u20', 'data mining'
'test\u20',
'data mining',
'test1']},
{'title': 'title2',
'tags': ['title2',
'data mining\u20]
}
]期望的字典
[{'title': 'title1',
'tags': ['data mining', 'data mining'
'test',
'data mining',
'test1']},
{'title': 'title2',
'tags': ['test',
'data mining]
}
]发布于 2021-09-28 18:29:49
您可以使用replace方法.replace("\u0020", "")替换用转义序列\u20表示的unicode space character。下面的代码迭代列表中的字典,然后使用更新的版本重新分配tags,通过列表理解删除这些字符。
>>> ds = [
... {
... 'title': 'title1',
... 'tags': [
... 'data mining\u0020',
... 'data mining',
... 'test\u0020',
... 'data mining',
... 'test1',
... ]
... },
... {
... 'title': 'title2',
... 'tags': [
... 'title2',
... 'data mining\u0020',
... ]
... }
...
... ]
>>> for d in ds:
... d['tags'] = [ tag.replace("\u0020", "") for tag in d['tags'] ]
...
>>> ds
[{'title': 'title1', 'tags': ['datamining', 'datamining', 'test', 'datamining', 'test1']}, {'title': 'title2', 'tags': ['title2', 'datamining']}]https://stackoverflow.com/questions/69366608
复制相似问题