问R中的数据处理
EN

Data Science用户

提问于 2017-08-06 04:26:40

回答 1查看 117关注 0票数 2

我有一个长的数据框架，有96个连续的观察属于相同的变量。我必须有两个这样的变量。一个变量是用"param2(kWh)“表示的能量，另一个是用"param2(kW)”表示的需求。所以数据帧就像--

第一行的变量描述为"Interval“和"param2(kWh)”，然后是属于能源变量的96个观测值，第98行的变量描述为"Interval“和"param2(kW)”，然后是属于需求变量的96个观测。

在此之后，又有一行被描述为"Interval“和"param2(kWh)”，然后是属于能量变量的96个观测值。在此之后，又出现了描述变量“区间”和"param2(kW)“的行描述变量，以及属于需求变量的96个观测值，这两个变量之间的这种相互交织作用--能量和需求--持续了很长时间。

目标是有两个单独的数据框架，一个用于能源，即"param2(kWh)“，另一个用于需求，即"param2(kW)”。这两个数据帧是如何从上述单个数据框架中形成的？

我是附加的数据框架的互联网网站。

https://1drv.ms/f/s!Apm2LEjQkhz3aNBBoUygHPMz2_E

回答 1

Data Science用户

发布于 2017-08-09 13:55:08

这里有一种方法可以根据数据生成两个数据帧。

# read data
dat <- read.csv("sample csv1.csv", stringsAsFactors = FALSE, header = FALSE)

# find rows containing "Interval"
idx_int <- dat[[1]] == "Interval"

# calculate groups
group <- cumsum(idx_int) %% 2

# remove indices for "Interval" rows
group2 <- group[!idx_int]

# split data frame into two data frames
dat_list <- split(dat[!idx_int, ], group2)

# generate two separate data frames
dat_energy <- dat_list[[2]]  # Energy
dat_demand <- dat_list[[1]]  # Demand

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/22000

复制

相似问题

问R中的数据处理
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R中的数据处理EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R中的数据处理
EN