我得到了一个由三列组成的数据集。一个列有事务信息,一个列有存储号,另一个列有节。我的目标是使用实体提取从事务信息列中提取300个不同商店的存储号。我的思考过程是制作类似于公司如何使用字库搜索关键词的简历,因为我已经在一个单独的专栏中有商店编号。我将.csv文件读入我的程序,并将存储编号存储在自己的数组中。我试图找出如何在事务信息列中搜索这些商店号。
目前为止的代码:
import pandas as pd
import numpy as np
file = pd.read_csv(r'C:\Users\cspea\Desktop\assignment.csv')
print(file)
store_number_array = file['store_number'].to_numpy()
print(store_number_array)样本数据集(以.csv格式):
transaction_descriptor,store_number,dataset
DOLRTREE 2257 00022574 ROSWELL,2257,train
AUTOZONE #3547,3547,train
TGI FRIDAYS 1485 0000,1485,train
BUFFALO WILD WINGS 003,3,train
J. CREW #568 0,568,train任何提示都将不胜感激。(谢谢您的时间和提前提供的帮助:)
发布于 2022-05-08 20:30:40
试试这个:
df['c'] = df['transaction_descriptor'].apply(lambda x: (df[df['transaction_descriptor'].str.contains(x)]['store_number']))[0]
for index,row in df.loc[df['c'].isna(),:].iterrows():
test_=df.loc[index,'store_number']
test=df.loc[index,'transaction_descriptor']
result=[s for s in test.split() if str(test_) in s]
df.loc[index,'c']=resulthttps://stackoverflow.com/questions/72164620
复制相似问题