首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R中的数据处理

R中的数据处理
EN

Data Science用户
提问于 2017-08-06 04:26:40
回答 1查看 117关注 0票数 2

我有一个长的数据框架,有96个连续的观察属于相同的变量。我必须有两个这样的变量。一个变量是用"param2(kWh)“表示的能量,另一个是用"param2(kW)”表示的需求。所以数据帧就像--

第一行的变量描述为"Interval“和"param2(kWh)”,然后是属于能源变量的96个观测值,第98行的变量描述为"Interval“和"param2(kW)”,然后是属于需求变量的96个观测。

在此之后,又有一行被描述为"Interval“和"param2(kWh)”,然后是属于能量变量的96个观测值。在此之后,又出现了描述变量“区间”和"param2(kW)“的行描述变量,以及属于需求变量的96个观测值,这两个变量之间的这种相互交织作用--能量和需求--持续了很长时间。

目标是有两个单独的数据框架,一个用于能源,即"param2(kWh)“,另一个用于需求,即"param2(kW)”。这两个数据帧是如何从上述单个数据框架中形成的?

我是附加的数据框架的互联网网站。

https://1drv.ms/f/s!Apm2LEjQkhz3aNBBoUygHPMz2_E

EN

回答 1

Data Science用户

发布于 2017-08-09 13:55:08

这里有一种方法可以根据数据生成两个数据帧。

代码语言:javascript
复制
# read data
dat <- read.csv("sample csv1.csv", stringsAsFactors = FALSE, header = FALSE)

# find rows containing "Interval"
idx_int <- dat[[1]] == "Interval"

# calculate groups
group <- cumsum(idx_int) %% 2

# remove indices for "Interval" rows
group2 <- group[!idx_int]

# split data frame into two data frames
dat_list <- split(dat[!idx_int, ], group2)

# generate two separate data frames
dat_energy <- dat_list[[2]]  # Energy
dat_demand <- dat_list[[1]]  # Demand
票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/22000

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档