我有一个长的数据框架,有96个连续的观察属于相同的变量。我必须有两个这样的变量。一个变量是用"param2(kWh)“表示的能量,另一个是用"param2(kW)”表示的需求。所以数据帧就像--
第一行的变量描述为"Interval“和"param2(kWh)”,然后是属于能源变量的96个观测值,第98行的变量描述为"Interval“和"param2(kW)”,然后是属于需求变量的96个观测。
在此之后,又有一行被描述为"Interval“和"param2(kWh)”,然后是属于能量变量的96个观测值。在此之后,又出现了描述变量“区间”和"param2(kW)“的行描述变量,以及属于需求变量的96个观测值,这两个变量之间的这种相互交织作用--能量和需求--持续了很长时间。
目标是有两个单独的数据框架,一个用于能源,即"param2(kWh)“,另一个用于需求,即"param2(kW)”。这两个数据帧是如何从上述单个数据框架中形成的?
我是附加的数据框架的互联网网站。
发布于 2017-08-09 13:55:08
这里有一种方法可以根据数据生成两个数据帧。
# read data
dat <- read.csv("sample csv1.csv", stringsAsFactors = FALSE, header = FALSE)
# find rows containing "Interval"
idx_int <- dat[[1]] == "Interval"
# calculate groups
group <- cumsum(idx_int) %% 2
# remove indices for "Interval" rows
group2 <- group[!idx_int]
# split data frame into two data frames
dat_list <- split(dat[!idx_int, ], group2)
# generate two separate data frames
dat_energy <- dat_list[[2]] # Energy
dat_demand <- dat_list[[1]] # Demandhttps://datascience.stackexchange.com/questions/22000
复制相似问题