首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >频率关系矩阵

频率关系矩阵
EN

Stack Overflow用户
提问于 2017-10-26 18:19:26
回答 1查看 99关注 0票数 1

我有一个如下所示的数据集:

代码语言:javascript
复制
col1  |  col2    |  col3
A     |  yellow  |  ID1
B     |  yellow  |  ID1
A     |  red     |  ID2
C     |  blue    |  ID2

我想要的是一个矩阵,在这个矩阵中,我可以看到A和B,A和C等等之间有多少ID是相同的。

代码语言:javascript
复制
   |  A   |  B   |  C
A  |  --  |  1   |  1
B  |  1   |  --  |  0
C  |  1   |  0   |  --

类似于上面的内容。我认为这个结构有一个合适的名字,但我找不到它。我正在寻找一个使用Excel (首选)或R的解决方案。最简单的方法是什么?

下面的问题是,我如何知道哪些ID是共同的?

EN

回答 1

Stack Overflow用户

发布于 2017-10-26 18:39:22

你可以这样做:

代码语言:javascript
复制
m <- df[,-2]
m <- table(m)
m <- m %*% t(m)
diag(m) <- NA
#   col1
# col1 A  B  C
#   A NA  1  1
#   B  1 NA  0
#   C  1  0 NA

要搜索的关键字可能是关联矩阵、二分网络/附属网络、双模网络到单模网络和邻接矩阵。

使用的数据:

代码语言:javascript
复制
df<-read.table(header=T,sep="|",text="col1|col2|col3
A|yellow|ID1
B|yellow|ID1
A|red|ID2
C|blue|ID2")
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46951821

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档