首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >agrep函数中的重复项

agrep函数中的重复项
EN

Stack Overflow用户
提问于 2019-02-18 09:20:31
回答 1查看 85关注 0票数 1

我有以下代码:

代码语言:javascript
复制
x <- data.frame("SN" = 1:2, "Name" = c("aaa","bbb"))

y <- data.frame("SN" = 1:2,  "Name" = c("aa1","aa2"))

x$partials<- as.character(sapply(x$Name, agrep, y$Name,max.distance = 1,value=T))

x

输出如下:

代码语言:javascript
复制
    > x
  SN Name        partials
1  1  aaa c("aa1", "aa2")
2  2  bbb    character(0)

但是,我期望得到以下输出:

有什么想法吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-02-18 10:52:49

你可能在找这个。

首先,如果是sapply()character(0)就什么也不提。为了防止这种情况,您可以说是NA或text "character(0)",如果您真的想这样做的话。

代码语言:javascript
复制
z <- setNames(sapply(x$Name, function(a) {
  ag <- agrep(a, y$Name, max.distance=1, value=TRUE)
  if (identical(ag, character(0))) NA  # set to "character(0)" at will
  else ag
  }), x$Name)

然后,将得到的列表转换为矩阵。

代码语言:javascript
复制
z <- do.call(rbind, z)

我们需要melt()它来获得正确的格式。一个很好的方法是使用data.table

代码语言:javascript
复制
library(data.table)
z <- setNames(melt(z)[-2], c("Name", "partials"))

现在,我们只需将x与新数据合并,以获得结果,从而确保z的唯一行。

代码语言:javascript
复制
res <- merge(x, unique(z))[c(2, 1, 3)]

> res
  SN Name partials
1  1  aaa      aa1
2  1  aaa      aa2
3  2  bbb     <NA>
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54743923

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档