我基本上是在计算一组变量的PCA,一切都很好。假设我是以虹膜数据为例,但我的数据是不同的。虹膜数据应该足以解释我的问题:
data(iris)
log.ir <- log(iris[, 1:4])
log.ir[mapply(is.infinite, log.ir)] <- 0
ir.groups<- iris[, 5]
ir.pca <- prcomp(log.ir, center = TRUE, scale. = TRUE)
library(ggbiplot)
g <- ggbiplot(ir.pca, obs.scale = 1,var.scale = 1,groups = ir.groups, var.axes=F)
g <- g + scale_color_discrete(name = '')
g <- g + theme(legend.direction = 'horizontal',
legend.position = 'top') + theme(legend.text=element_text(size=15), legend.key.size = unit(2.5, "lines")) + theme(text = element_text(size=20))
ggsave("pca2.pdf", g, width=15, height=15)当我得到这个图时,一些组被绘制得太近了,所以我想为这个组子集绘制一个新的图(而不需要为子集计算一个新的PCA )。
是否有一种方法可以使ir.pca对象的子集只选择要绘制的特定groups?
发布于 2016-05-25 17:45:09
我认为您可以用ggplot2::coord_equal定义一个新的图形窗口,例如:
g + coord_equal(xlim=c(0, 3))将setosa从图表中排除,而不是从主成分分析中排除。
考虑到您的评论,您可以通过编程方式进行:
# first we filter the scores
filtered_scores <- ir.pca$x[which(iris$Species != "setosa"), ]
# then on PC1 and PC2
g + coord_equal(xlim=range(filtered_scores[, 1]), ylim=range(filtered_scores[, 2]))这就是你想要的吗?
https://stackoverflow.com/questions/37442920
复制相似问题