文章/答案/技术大牛

发布

社区首页 >问答首页 >对嵌套列表/环境进行索引的有效(或最有效)方法是什么？

问对嵌套列表/环境进行索引的有效(或最有效)方法是什么？
EN

Stack Overflow用户

提问于 2011-11-20 22:31:41

回答 2查看 284关注 0票数 3

我喜欢在正式类的对象过于僵化的情况下列表的灵活性。基本上，它们可以用于映射从操作系统的标准文件系统中我们在概念上习惯的处理树结构的方法。

然而，为了掌握超过3或4的“嵌套度”，您需要一种计算嵌套列表索引的方法。一旦有了这样的索引，就不难选择一个特定的分支，更新它，向列表中添加新的分支，简而言之:在操作系统的文件系统中完成我们对文件和文件夹所做的所有事情。

示例

基本上，str(object)已经完成了任务，但只输出文本(capture.output(str(object)) )。我想把它转换成数据帧结构

示例列表

setClass("TESTCLASS_X", representation=representation(a="numeric"))
setRefClass("TESTCLASS_Y", fields=list(a="numeric"))

src <- list(
    a=list(
        a.1=list(a.1.1 = 1, a.1.2 = 1:5, a.1.3 = integer(0)),
        a.2=list(a.2.1="a", a.2.2=c("a", "b", "c", "d", "e"), a.2.3=character()),
        a.3=list(a.3.1=1.5, a.3.2=c(1.5, 2.5), a.3.3=numeric()), 
        a.4=list(a.4.1=1+1i, a.4.2=c(0.1+0.3i, 0.2+0.2i, 0.1+0.1i), a.4.3=complex()),  
        a.5=list(a.5.1 = TRUE, a.5.2 = c(TRUE, TRUE, TRUE), a.5.3 = logical())
    ), 
    b=list(
        b.1=list(
            b.1.1=list(b.1.1.1 =matrix(1, ncol=1),
                b.1.1.2=matrix(c(1:4), ncol=2, dimnames=list(NULL, c("a","b"))),
                b.1.1.3=matrix()
            ),
            b.1.2=list(b.1.2.1=data.frame(1), b.1.2.2=data.frame(a=1:3, b=1:3),
                b.1.2.3=data.frame() 
            )
        ),
        b.2=list(
            b.2.1=list(b.2.1.1=list(a=1), b.2.1.2=list(a=1:2, b=letters[1:2]),
                b.2.1.3=list(a=1:2, b="a", c=1:3, d=FALSE, e=1:5), b.2.1.4=list()
            )
        )
    ),
    c=list(
        c.1=list(c.1.1=new.env(), c.1.2=new("TESTCLASS_X", a=1:5), 
            c.1.3=new("TESTCLASS_Y", a=1:5))
    )
)

期望输出

                    name pos is.top is.bottom       class is.s4  dim
1                      a   1   TRUE     FALSE        list FALSE    5
2                  a/a.1   2  FALSE     FALSE        list FALSE    3
3            a/a.1/a.1.1   3  FALSE      TRUE     numeric FALSE    1
4            a/a.1/a.1.2   3  FALSE      TRUE     integer FALSE    5
5            a/a.1/a.1.3   3  FALSE      TRUE     integer FALSE    0
6                  a/a.2   2  FALSE     FALSE        list FALSE    3
7            a/a.2/a.2.1   3  FALSE      TRUE   character FALSE    1
8            a/a.2/a.2.2   3  FALSE      TRUE   character FALSE    5
9            a/a.2/a.2.3   3  FALSE      TRUE   character FALSE    0
10                 a/a.3   2  FALSE     FALSE        list FALSE    3
11           a/a.3/a.3.1   3  FALSE      TRUE     numeric FALSE    1
12           a/a.3/a.3.2   3  FALSE      TRUE     numeric FALSE    2
13           a/a.3/a.3.3   3  FALSE      TRUE     numeric FALSE    0
14                 a/a.4   2  FALSE     FALSE        list FALSE    3
15           a/a.4/a.4.1   3  FALSE      TRUE     complex FALSE    1
16           a/a.4/a.4.2   3  FALSE      TRUE     complex FALSE    3
17           a/a.4/a.4.3   3  FALSE      TRUE     complex FALSE    0
18                 a/a.5   2  FALSE     FALSE        list FALSE    3
19           a/a.5/a.5.1   3  FALSE      TRUE     logical FALSE    1
20           a/a.5/a.5.2   3  FALSE      TRUE     logical FALSE    3
21           a/a.5/a.5.3   3  FALSE      TRUE     logical FALSE    0
22                     b   1   TRUE     FALSE        list FALSE    2
23                 b/b.1   2  FALSE     FALSE        list FALSE    2
24           b/b.1/b.1.1   3  FALSE     FALSE        list FALSE    3
25   b/b.1/b.1.1/b.1.1.1   4  FALSE      TRUE      matrix FALSE  1-1
26   b/b.1/b.1.1/b.1.1.2   4  FALSE      TRUE      matrix FALSE  2-2
27   b/b.1/b.1.1/b.1.1.3   4  FALSE      TRUE      matrix FALSE  1-1
28           b/b.1/b.1.2   3  FALSE     FALSE        list FALSE    3
29   b/b.1/b.1.2/b.1.2.1   4  FALSE      TRUE  data.frame FALSE  1-1
30   b/b.1/b.1.2/b.1.2.2   4  FALSE      TRUE  data.frame FALSE  3-2
31   b/b.1/b.1.2/b.1.2.3   4  FALSE      TRUE  data.frame FALSE  0-0
32                 b/b.2   2  FALSE     FALSE        list FALSE    1
33           b/b.2/b.2.1   3  FALSE     FALSE        list FALSE    4
34   b/b.2/b.2.1/b.2.1.1   4  FALSE     FALSE        list FALSE    1
35 b/b.2/b.2.1/b.2.1.1/a   5  FALSE      TRUE     numeric FALSE    1
36   b/b.2/b.2.1/b.2.1.2   4  FALSE     FALSE        list FALSE    2
37 b/b.2/b.2.1/b.2.1.2/a   5  FALSE      TRUE     integer FALSE    2
38 b/b.2/b.2.1/b.2.1.2/b   5  FALSE      TRUE   character FALSE    2
39   b/b.2/b.2.1/b.2.1.3   4  FALSE     FALSE        list FALSE    5
40 b/b.2/b.2.1/b.2.1.3/a   5  FALSE      TRUE     integer FALSE    2
41 b/b.2/b.2.1/b.2.1.3/b   5  FALSE      TRUE   character FALSE    1
42 b/b.2/b.2.1/b.2.1.3/c   5  FALSE      TRUE     integer FALSE    3
43 b/b.2/b.2.1/b.2.1.3/d   5  FALSE      TRUE     logical FALSE    1
44 b/b.2/b.2.1/b.2.1.3/e   5  FALSE      TRUE     integer FALSE    5
45   b/b.2/b.2.1/b.2.1.4   4  FALSE     FALSE        list FALSE    0
46                     c   1   TRUE     FALSE        list FALSE    1
47                 c/c.1   2  FALSE     FALSE        list FALSE    3
48           c/c.1/c.1.1   3  FALSE      TRUE environment FALSE <NA>
49           c/c.1/c.1.2   3  FALSE      TRUE TESTCLASS_X  TRUE    1
50           c/c.1/c.1.3   3  FALSE      TRUE TESTCLASS_Y  TRUE    1

编辑2011-11-21

Spacedman问我，这是否仅仅是深度优先搜索的结果。当然是，但是

我与它的递归性质作了斗争
我认为“手动”深度优先可能总是比依赖capture.output(str()效率低，因为这是基于C (IIRC)的。

下面是一些类似于我的第一个深度优先方法的东西：

src是从上面取来的

objIndex <- function(src){
    out <- lapply(1:length(src), function(x){
        if(class(src[[x]]) == "list"){
            if(length(src[[x]])){
                df.1 <- objIndex(src=src[[x]])
            } else {
                df.1 <- data.frame(
                    path=names(src[x]),
                    pos=NA,
                    is.top=FALSE,
                    is.bottom=TRUE,
                    class=class(src[[x]]),
                    dim=length(src[[x]])
                )    
            }
        } else {
            df.1 <- data.frame(
                path=ifelse(is.null(names(src[x])), NA, names(src[x])),
                pos=NA,
                is.top=FALSE,
                is.bottom=TRUE,
                class=class(src[[x]]),
                dim=length(src[[x]])
            )    
        }  
        df.1
    })
    return(out)
}
> objIndex(src, df=NULL)
[[1]]
[[1]][[1]]
[[1]][[1]][[1]]
   path pos is.top is.bottom   class dim
1 a.1.1  NA  FALSE      TRUE numeric   1

[[1]][[1]][[2]]
   path pos is.top is.bottom   class dim
1 a.1.2  NA  FALSE      TRUE integer   5

[[1]][[1]][[3]]
   path pos is.top is.bottom   class dim
1 a.1.3  NA  FALSE      TRUE integer   0


[[1]][[2]]
[[1]][[2]][[1]]
   path pos is.top is.bottom     class dim
1 a.2.1  NA  FALSE      TRUE character   1

[[1]][[2]][[2]]
   path pos is.top is.bottom     class dim
1 a.2.2  NA  FALSE      TRUE character   5

[[1]][[2]][[3]]
   path pos is.top is.bottom     class dim
1 a.2.3  NA  FALSE      TRUE character   0


[[1]][[3]]
[[1]][[3]][[1]]
   path pos is.top is.bottom   class dim
1 a.3.1  NA  FALSE      TRUE numeric   1

[[1]][[3]][[2]]
   path pos is.top is.bottom   class dim
1 a.3.2  NA  FALSE      TRUE numeric   2

[[1]][[3]][[3]]
   path pos is.top is.bottom   class dim
1 a.3.3  NA  FALSE      TRUE numeric   0


[[1]][[4]]
[[1]][[4]][[1]]
   path pos is.top is.bottom   class dim
1 a.4.1  NA  FALSE      TRUE complex   1

[[1]][[4]][[2]]
   path pos is.top is.bottom   class dim
1 a.4.2  NA  FALSE      TRUE complex   3

[[1]][[4]][[3]]
   path pos is.top is.bottom   class dim
1 a.4.3  NA  FALSE      TRUE complex   0


[[1]][[5]]
[[1]][[5]][[1]]
   path pos is.top is.bottom   class dim
1 a.5.1  NA  FALSE      TRUE logical   1

[[1]][[5]][[2]]
   path pos is.top is.bottom   class dim
1 a.5.2  NA  FALSE      TRUE logical   3

[[1]][[5]][[3]]
   path pos is.top is.bottom   class dim
1 a.5.3  NA  FALSE      TRUE logical   0



[[2]]
[[2]][[1]]
[[2]][[1]][[1]]
[[2]][[1]][[1]][[1]]
     path pos is.top is.bottom  class dim
1 b.1.1.1  NA  FALSE      TRUE matrix   1

[[2]][[1]][[1]][[2]]
     path pos is.top is.bottom  class dim
1 b.1.1.2  NA  FALSE      TRUE matrix   4

[[2]][[1]][[1]][[3]]
     path pos is.top is.bottom  class dim
1 b.1.1.3  NA  FALSE      TRUE matrix   1


[[2]][[1]][[2]]
[[2]][[1]][[2]][[1]]
     path pos is.top is.bottom      class dim
1 b.1.2.1  NA  FALSE      TRUE data.frame   1

[[2]][[1]][[2]][[2]]
     path pos is.top is.bottom      class dim
1 b.1.2.2  NA  FALSE      TRUE data.frame   2

[[2]][[1]][[2]][[3]]
     path pos is.top is.bottom      class dim
1 b.1.2.3  NA  FALSE      TRUE data.frame   0



[[2]][[2]]
[[2]][[2]][[1]]
[[2]][[2]][[1]][[1]]
[[2]][[2]][[1]][[1]][[1]]
   path pos is.top is.bottom   class dim
1 <<1>>  NA  FALSE      TRUE numeric   1


[[2]][[2]][[1]][[2]]
[[2]][[2]][[1]][[2]][[1]]
  path pos is.top is.bottom   class dim
1    a  NA  FALSE      TRUE integer   2

[[2]][[2]][[1]][[2]][[2]]
  path pos is.top is.bottom     class dim
1    b  NA  FALSE      TRUE character   2


[[2]][[2]][[1]][[3]]
[[2]][[2]][[1]][[3]][[1]]
   path pos is.top is.bottom   class dim
1 <<1>>  NA  FALSE      TRUE integer   2

[[2]][[2]][[1]][[3]][[2]]
   path pos is.top is.bottom     class dim
1 <<2>>  NA  FALSE      TRUE character   1

[[2]][[2]][[1]][[3]][[3]]
   path pos is.top is.bottom   class dim
1 <<3>>  NA  FALSE      TRUE integer   3

[[2]][[2]][[1]][[3]][[4]]
   path pos is.top is.bottom   class dim
1 <<4>>  NA  FALSE      TRUE logical   1

[[2]][[2]][[1]][[3]][[5]]
   path pos is.top is.bottom   class dim
1 <<5>>  NA  FALSE      TRUE integer   5


[[2]][[2]][[1]][[4]]
     path pos is.top is.bottom class dim
1 b.2.1.4  NA  FALSE      TRUE  list   0




[[3]]
[[3]][[1]]
[[3]][[1]][[1]]
   path pos is.top is.bottom       class dim
1 c.1.1  NA  FALSE      TRUE environment   0

[[3]][[1]][[2]]
   path pos is.top is.bottom       class dim
1 c.1.2  NA  FALSE      TRUE TESTCLASS_X   1

[[3]][[1]][[3]]
   path pos is.top is.bottom       class dim
1 c.1.3  NA  FALSE      TRUE TESTCLASS_Y   1

list

indexing

nested

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-11-21 13:52:22

利用rapply可以得到部分解。这只计算终端节点的值，因此您可以得到数据帧中is.bottom为TRUE的部分。从检查名称中获得表的其余部分应该是可能的，但我怀疑它是愚蠢的，而且这些节点都相当无聊(所有这些节点都是class = "list"、is.S4 = FALSE)。

class和is.S4列很容易获得。

out_class <- rapply(src, class)    
out_isS4 <- rapply(src, isS4)

我不太清楚您对dim列做了什么，但是类似的调用应该会让您开始。

out_dim <- rapply(src, length)

一定要得到你想要的名字，我们用的技巧是，在有一个点的地方，用斜线分隔符，后面跟着一个字母。如果列表中没有命名元素，这可能会中断，尽管我还没有对其进行测试。

sep <- "/"
out_name <- gsub("\\.(?=[[:alpha:]])", sep, names(out_class), perl = TRUE)

同样，嵌套的深度可以从您刚才添加到名称中的斜杠数中找到。

out_pos <- sapply(strsplit(out_name, sep), length)

最后，我们将它们合并成一个数据框架。

(out <- data.frame(
  name = out_name,
  pos = out_pos,
  class = out_class,
  is.S4 = out_isS4,
  dim = out_dim  
))

票数 2

Stack Overflow用户

发布于 2011-11-20 22:34:06

经过两种糟糕的方法之后，我想出了一种发布这里的方法。然而，它仍然觉得这是太复杂，它可以更容易实现。

我对这种糟糕的格式感到非常抱歉！几天后我会把代码移到上。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/8205300

复制

相似问题

问对嵌套列表/环境进行索引的有效(或最有效)方法是什么？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问对嵌套列表/环境进行索引的有效(或最有效)方法是什么？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问对嵌套列表/环境进行索引的有效(或最有效)方法是什么？
EN