我使用sqldf函数连接两个表&创建一个最后的表来绘制散图。我的最后一张表有6个变量,如下:
'data.frame': 11520 obs. of 6 variables:
`$ DATE : chr "01/01/2013" "01/01/2013" "01/01/2013" "01/01/2013" ...
`$ HOUR_NUM : int 1 2 3 4 5 6 7 8 9 10 ...'
`$ CONGESTION_ZONE_CD: Factor w/ 4 levels "H","N","S","W": 1 1 1 1 1 1 1 1 1 1 ...'
`$ DAY_TYPE_CD : Factor w/ 2 levels "WD","WE": 1 1 1 1 1 1 1 1 1 1 ...'
`$ LOAD : num 182 171 158 147 141 ...'
`$ AVG_TEMP : num 66.3 65.9 66.3 65 62.9 61.4 58.3 56.7 55.5 54.3 ...'我使用简单的绘图函数来得到散点图。
`TOTAL_LOAD = WE_TABLE$LOAD'
`TEMP = WE_TABLE$AVG_TEMP
`plot(TEMP, TOTAL_LOAD, col="blue")效果很好!现在,我再次使用sqldf来创建一个子集,其中拥塞_ZONE_CD=‘H’&为diff表(H)再次重写该coad。北方、南部和西部也是如此。因此,基本上创建4个子集表&重写相同的代码。我的第一个问题是:‘
1)我能一次输出所有四种不同类型区域的散点图吗?(我读了很多关于“by”函数的内容,但无法用它来完成这个任务。)
现在,在第二部分,当我为每个区域做散点图时,我知道我有工作日(WD)和周末(我们)。但,
2.)有没有一种方法可以根据WD & WE (DAY_TYPE_CD作为因子)对我的散点图进行颜色编码(让我们用蓝色表示WD,红色表示我们)?
真的很想提前感谢你们!从那以后,我仍然是一个研究和研究的初学者,我已经检查了散乱点的问题,然后才在这里发布。我有一种感觉,这可能有一个简单的解决方案,我不知道。
再次感谢。
dput(表)结构(日期= c("01/01/2013“、"01/01/2013”、"01/01/2013“、"01/01/2013”、"01/01/2013“、"01/01/2013”、"01/01/2013“、"01/01/2013”、"01/01/2013“、"01/01/2013")、HOUR_NUM = 1:10、CONGESTION_ZONE_CD =结构(c(1L)、1L,1L,1L,1L,1L,1L,1L,1L),.Label = c("H","N","S","W"),类=“因子”,DAY_TYPE_CD =结构(c( 1L,1L,1L,1L,1L,1L,1L),.Label = c("WD",“我们”),类=“因子”,负荷= c(181.801152,170.512058,157.95493,147.299889,140.645532,139.216646,141.670543,149.122035,160.893591,181.996018 ),AVG_TEMP = c(66.3,65.9,66.3,65,62.9,61.4,58.3,56.7,55.5,54.3),.Names =c(“日期”,"HOUR_NUM","CONGESTION_ZONE_CD","DAY_TYPE_CD","LOAD",(AVG_TEMP),row.names = c(NA,10L),class = "data.frame")
发布于 2014-01-02 16:33:42
因此,更好的方法是使用ggplot:
# not tested...
library(ggplot2)
# all on one plot
ggplot(df) + geom_point(aes(x=AVG_TEMP,y=TOTAL_LOAD,color=CONGESTION_ZONE))
#four plots
ggplot(df) + geom_point(aes(x=AVG_TEMP,y=TOTAL_LOAD)) +
facet_wrap(~CONGESTION_ZONE)
# coloring beased on day_type
ggplot(df) + geom_point(aes(x=AVG_TEMP,y=TOTAL_LOAD, color=DAY_TYPE_CD))+
facet_wrap(~CONGESTION_ZONE)https://stackoverflow.com/questions/20887003
复制相似问题