我有两个数据
前任:
df1:
seq_id1 seq_id2
seq1_A seq2_B
seq2_A seq3_B
seq4_A seq9_B
seq9_A seq9_B
etc还有另一个数据
df2:
sequences
seq2_A
seq9_A并且只保留在第一个dataframe中,也就是在dataframe中的ID存在的行中,在这里它应该是:
newdataframe合并:
seq_id1 seq_id2
seq2_A seq3_B
seq9_A seq9_B(谢谢你的帮助:)
这里。dataframe=第一个只有60行:df1第二个带有所有seq:df2,这里,第一个df中的列["#qseqid'"]必须与列["seq2_id"]中的受限df2匹配吗?
发布于 2018-05-16 12:04:06
我认为需要匹配列seq_id1和df2['sequences']使用isin和boolean indexing
df1[df1['seq_id1'].isin(df2['sequences'])]或者:
df = pd.merge(df1, df2, left_on='seq_id1', right_on='sequences')如果需要,则匹配df1的两列
df1[df1.isin(df2['sequences']).any(axis=1)]https://stackoverflow.com/questions/50370410
复制相似问题