我有两个大的数据帧。“gene”的结构是这样的(虽然超过三列):
Mutation ID CDS Mutation AA
COSM1000525 123 V617A
COSM1003371 234 S517A
COSM1003372 456 T417A
COSM1004880 567 K317A
COSM1004881 1234 R610A
COSM1004883 1234 V617A
COSM1004884 543 W617A
COSM1006396 132 Y617A
COSM1007340 7654 V617A“output”是“基因”的一部分,并且只有一列Mutation ID
Mutation ID
COSM1000525
COSM1003372
COSM1004881 我想做一个新的数据帧,当突变ID与“输出”中的那些相匹配时,它有两列(Mutation ID和Mutation AA)的“基因”。
如何在python中实现它?
发布于 2018-01-26 10:07:39
Pandas Indexing and Selecting Data是一个很好的指南。
mut_filter = set(output['Mutation ID'])
df = gene.loc[gene['Mutation'].isin(mut_filter), ['Mutation ID', 'Mutation AA']]https://stackoverflow.com/questions/48454720
复制相似问题