首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R使用大型数据集中止吗?

R使用大型数据集中止吗?
EN

Stack Overflow用户
提问于 2022-06-29 17:07:31
回答 1查看 96关注 0票数 0

我在比较质谱峰,在R Studio中创建一个分子树状图。我有88,336个元素,包含48.2MB的总内存。我是在一个64 GB内存和英特尔(R)核心(商标)i9-9900kcpu@ 3.60 GHz的桌面上运行的。

我正在计算igraph网络中的峰值、'net‘net.dist <- distances(net)和计算机崩溃的距离,它们说"R会话终止了。r遇到了一个致命的错误。会话被终止了。“

我对计算机还不太了解,无法解决这个问题。我认为这是因为有那么多的峰值需要计算,但我也假设桌面应该能够处理它们?

在崩溃期间,我的session会话仅为7.56 GiB。该C驱动器有513 GB的免费。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-06-29 20:26:11

目前,R/igraph只能处理最多包含2^31 - 1元素的矩阵,并且在没有警告的情况下会失败。未来的版本将更加健壮,不会崩溃。对于具有n顶点的图,距离矩阵将包含n*n元素。因此,对于具有n = 46340顶点以上的图,不能计算全距离矩阵。

但是,您可以通过将vdistances参数设置为顶点集中的一部分来逐块计算距离矩阵。

请注意,不超过2^31 - 1矩阵元素的限制来自R使用32位整数,甚至在64位平台上。还请注意,存储这许多元素已经占用了16 GB的内存。88336个顶点的全距离矩阵将占用59 GB内存,计算起来需要相当长的时间。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72805323

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档