我想匹配所有以978号开头的单元格。但是下面的代码也与397854或nan匹配。
an_transaction_product["kniha"] = np.where(an_transaction_product["zbozi_ean"].str.contains('^978', regex=True) , 1, 0)请问我做错了什么?
发布于 2022-05-31 13:50:39
这不起作用,因为.str.contains将检查正则表达式是否发生在字符串中的任何位置。
如果您坚持使用regex,.str.match会做您想做的事情。
但是对于这个简单的例子,.str.startswith("978")就更清楚了。
发布于 2022-05-31 14:09:19
除了regex之外,您还可以使用.loc查找以'978‘开头的单元格。下面的代码将在“A”列中将1指定给这类单元格,举个例子:
df.loc[df['A'].astype(str).str[:3]=='978', 'A'] = 1注意: astype(str)将数字转换为字符串,然后str:3获取前3个字符,然后将其与'978‘进行比较。
https://stackoverflow.com/questions/72448863
复制相似问题