我在ggplot2 R包中使用mpg数据集。
classify = function(cls){
if (cls == "suv" || cls == "pickup"){result = 1}
else {result = 0}
return(result)
}
mpg = mpg %>% mutate(size = sapply(class, classify))
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, alpha = size))现在,size只能接受两个值:1类为suv或pickup时,否则为0。但在结果的情节中,我得到了一个奇怪的“平滑”大小范围:

(让我惊讶的并不是传说,而是使用alpha 0.1或0.3或其他任何东西绘制的值。)
到底怎么回事?
发布于 2019-10-23 13:47:14
(这并不是令我惊讶的传说,而是使用alpha 0.1或0.3或其他任何东西绘制的值。)
没有,你看到的是多个点有完全相同的离散坐标,所以半透明点重叠。
要修复图例,请使用因子或字符串(=离散)代替数字(=连续)。
不相关,但您的classify实现是非常非传统的代码。首先,由于R是一种函数式语言,所以所有表达式都是值。这意味着,与其在if中执行赋值,不如通常分配if的结果
result = if (cls == "suv" || cls == "pickup") 1 else 0此外,不需要result变量,也不需要return函数调用(在R中执行早期退出)。相反,一个惯用的R实现看起来如下:
classify = function(cls) {
if (cls == "suv" || cls == "pickup") 1 else 0
}更好的方法是使用矢量化的ifelse而不是非矢量的if。
classify = function(cls) {
ifelse(cls == "suv" | cls == "pickup", 1, 0)
}现在您可以不用classify使用sapply了。
mpg = mpg %>% mutate(size = classify(class))https://stackoverflow.com/questions/58524281
复制相似问题