我有关于x和y位置的二维数据,最多可以容纳上百万个细胞。我想把这些单元格自动注释到不同的位置。在下面的例子中,我希望找到4个与4个椭圆对应的簇。到目前为止,我尝试了kmeans和GMM,但未能正确地将细胞注入到预期的集群中。HDBSCAN能够在单元格的子集上这样做,但受到整个数据集上RAM的限制。还有其他的R工具适合这个用例吗?谢谢

发布于 2022-01-24 13:48:57
查找R.的stream包,它的目的是对一个数据流而不是固定的数据集进行分析,因此它可以处理有限的内存资源。在stream中,如果不知道集群的数量,可以使用桦木算法。但也有其他集群算法的流版本可用。
https://stackoverflow.com/questions/70834778
复制相似问题