首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用R data.table foverlaps()或IRanges按预期计算重叠

使用R data.table foverlaps()或IRanges按预期计算重叠
EN

Stack Overflow用户
提问于 2019-04-15 04:46:06
回答 1查看 338关注 0票数 3

正如我所期望的那样,我很难计算出重叠的区间。这是一个由开始到结束定义的间隔的R data.table:

代码语言:javascript
复制
> library(data.table)
> dt1 = data.table(start=c(1, 5, 3), end=c(10, 15, 8))
> print(dt1)
   start end
1:     1  10
2:     5  15
3:     3   8

以下是我如何考虑这些间隔的重叠,从0到20:

代码语言:javascript
复制
[0, 1]: 0 (there are no intervals here)
[1, 3]: 1 (there is only one interval here, from [1, 10])
[3, 5]: 2 (two intervals here, both [1, 10] and [3, 8])
[5, 8]: 3
[8, 10]: 1
[10, 15]: 1
[15, 20]: 0

所以,我想以算法的方式输出。类似于:

代码语言:javascript
复制
   start end  overlaps
1:     0  1   0
2:     1  3   1
3:     3  5   2
4:     5  8   3      
5:     8  10  2      
6:    10  15  1      
7:    15  20  0   

但是,我找不到如何使用R data.table中的foverlaps()IRanges的各种函数来实现这一点。

代码语言:javascript
复制
> setkey(dt1, start, end)
> foverlaps(dt1, dt1, type="any")
   start end i.start i.end
1:     1  10       1    10
2:     3   8       1    10
3:     5  15       1    10
4:     1  10       3     8
5:     3   8       3     8
6:     5  15       3     8
7:     1  10       5    15
8:     3   8       5    15
9:     5  15       5    15
> foverlaps(dt1, dt1, type="within")
   start end i.start i.end
1:     1  10       1    10
2:     1  10       3     8
3:     3   8       3     8
4:     5  15       5    15

为了计算某个间隔内的重叠,这两个参数似乎都不相关。

查看IRanges也不能给出预期的重叠间隔计数:

代码语言:javascript
复制
> library(IRanges)
> range1
IRanges object with 3 ranges and 0 metadata columns:
          start       end     width
      <integer> <integer> <integer>
  [1]         1        10        10
  [2]         3         8         6
  [3]         5        15        11
> countOverlaps(range1, range1)
[1] 3 3 3
> countOverlaps(range1, range1, type="within")
[1] 1 2 1

如何计算重叠区间?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-04-15 07:59:05

代码语言:javascript
复制
> # Where do the 0 and the 20 come from?
> points <- c(0, sort(c(dt1$start, dt1$end)), 20)
> x <- do.call(IRanges,
+              transpose(Map(c, start=head(points, -1), end=tail(points, -1))))
> x
IRanges object with 7 ranges and 0 metadata columns:
          start       end     width
      <integer> <integer> <integer>
  [1]         0         1         2
  [2]         1         3         3
  [3]         3         5         3
  [4]         5         8         4
  [5]         8        10         3
  [6]        10        15         6
  [7]        15        20         6
> y <- do.call(IRanges, dt1)
> y
IRanges object with 3 ranges and 0 metadata columns:
          start       end     width
      <integer> <integer> <integer>
  [1]         1        10        10
  [2]         3         8         6
  [3]         5        15        11
> countOverlaps(x, y, type="within")
[1] 0 1 2 3 2 1 0

第五个结果略有不同,但确实有2个重叠,因为8,10与1,10和5,15重叠。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55679894

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档