我有一个很大的基因列表,我想查找同源基因。
我还有一个很大的数据框架,里面有潜在的同源数据。此Dataframe的第十列继承了一个数字,用于描述管件。数字越大越好。
我正在尝试遍历这个庞大的基因列表。
对于列表中的每个独特基因,我希望选择最适合的同源基因。
输出应该是每个基因一行的数据帧,描述最适合的同源基因。
发布于 2019-06-11 15:38:14
Tidyverse解决方案,假设您有一个列,每个基因都有一个gene_id,并且拟合分数在一个名为score的列中
library(tidyverse)
df %>% group_by(gene_id) %>% filter(score == max(score)) %>% ungroup()https://stackoverflow.com/questions/56538665
复制相似问题