我想知道如何在"non“或"no”之间加上下划线,以及使用python后的单词。谢谢你的进阶。例如,
输入数据:

预期输出数据:

发布于 2022-09-16 15:33:53
您可以使用熊猫“应用”方法如下所示。
将熊猫作为pd导入
def func(s):
tokens = s.split()
i = 0
while i<len(tokens):
if tokens[i] in ["no","non"] and i < len(tokens)-1:
tokens[i] = f"{tokens[i]}_{tokens[i+1]}"
tokens.pop(i+1)
i+=1
return ' '.join(tokens)
df = pd.DataFrame({'id':[1,2], "text":["no damage car", "non damage car"]})
df["text"] = df["text"].apply(func)生成的dataframe df:
id text
0 1 no_damage car
1 2 non_damage car当然,在正则表达式的帮助下,所应用的函数可以变得“更好”。
https://stackoverflow.com/questions/73746980
复制相似问题