假设因子变量是有序的,那么处理图中太多因子的最佳方法是什么?默认设置看起来不太好:
ggplot(data.frame(x=factor(trunc(runif(10000, 0, 100)), ordered=T)), aes(x=x)) +
geom_histogram()

发布于 2013-04-11 22:26:44
您可以反转这些值。
ggplot(data.frame(x=factor(trunc(runif(10000, 0, 100)), ordered=T)), aes(x=x)) +
theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
geom_histogram()
flip <- ggplot(data.frame(x=factor(trunc(runif(10000, 0, 100)), ordered=T)), aes(x=x)) +
theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
geom_histogram()如果它仍然对你的口味来说太密集,你可以设置手动中断。在本例中,我使用了五个。
prune <- ggplot(data.frame(x=factor(trunc(runif(10000, 0, 100)), ordered=T)), aes(x=x)) +
theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
scale_x_discrete(breaks = seq(0, 100, by = 5)) +
geom_histogram()
library(gridExtra)
grid.arrange(flip, prune)

发布于 2013-04-12 03:55:13
使用不同的可视化方法- dotplot()。您可以用一个点表示频率,并将因子移动到y轴以水平显示,而不是垂直显示。这种加号排序为您提供了每个因素的频率的简单可视指示器。它在标签上有点密集,但如果您缩放,仍会显示因子。下面是使用lattice的示例
library(lattice)
d <- sort(table(factor(trunc(runif(10000, 0, 100)))))
dotplot(d, col=1, cex=0.5, scales = list(y = list(cex=0.5)))

但也许你想要的是像因子频率直方图这样的东西,尽管我不知道你会用它做什么。只是不要旋转x轴标签,这会使它不可读。
d <- factor(trunc(runif(10000, 0, 100)))
histogram(d, scales = list(x = list(at=seq(1,length(levels(dd)),5))))

https://stackoverflow.com/questions/15951216
复制相似问题