首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我如何组织我的数据以匹配R中糖尿病数据集的结构?

我如何组织我的数据以匹配R中糖尿病数据集的结构?
EN

Stack Overflow用户
提问于 2020-03-24 00:15:53
回答 1查看 28关注 0票数 0

我想在R的monomvn包中构建类似于糖尿病数据集的我自己的数据,以尝试一些不同的回归模型示例(具体地说,套索回归)。

糖尿病数据列出了三个变量(x、x2和y),但x和x2都包含几个子级别的变量(如年龄、体重指数等)。这些x和x2变量在最终引用这些子级别变量的不同回归模型示例中被调用。

不幸的是,每当我试图组织我的数据以匹配糖尿病数据集时,它要么被强制到变量中的一个列表中(这阻止了示例的正常工作),要么没有被分类到单个x变量中(相反,将每个变量分别读取为x.age、x.bmi等)。我的目标是能够使用df$x引用多个变量;换句话说,df$x应该引用df$x.var1、df$x.var2、df$x.var3。我想在一个x变量中编码多达240个变量。

我能得到的最接近的是:

代码语言:javascript
复制
df$x.var1 <- data.frame(as.numeric(master_data$var1))
df$x.var2 <- data.frame(as.numeric(master_data$var2))
df$x.var3 <- data.frame(as.numeric(master_data$var3))

创建数据框时没有错误;但是,我仍然需要引用整个变量名(x.var1),而不是引用所有子变量的"x“,以便任何回归示例都能工作;使用这种方法,我不能在套索回归模型中将大约240个变量名列为x变量。

在Matlab语言中,我会将其结构化为子变量(var1、var2、var3等)的结构。在名为“x”的结构中;但是,我在R中执行此操作,目前无法看到如何完成该类型的任务。

我引用的糖尿病数据集在这里找到:

代码语言:javascript
复制
library(monomvn)
data(diabetes)

如果有用,糖尿病数据集将"x“和"x2”变量"AsIs“(尽管所有子变量看起来都是数字)分类,而"y”是数字。

仅供参考,我自己的数据集中确实有一些NA值,但我没有收到任何错误,使我认为这与这个问题有关;然而,糖尿病数据集没有NA值,所以我不排除这种可能性。

如果有人能提供一些关于如何将数字数据转换成与糖尿病数据集相匹配的格式的指导,那将是非常有帮助的。提前谢谢。

EN

回答 1

Stack Overflow用户

发布于 2020-03-24 02:07:42

man page将数据描述为包含以下列的data.frame :x是10列的矩阵,y是数值向量,x2是64列的矩阵。

问题是您试图将数据指定为data.frame的列。您需要首先组合这两个矩阵,然后将它们分配给data.frame。

如下所示:

代码语言:javascript
复制
mydata.x <- matrix(runif(500,-2,2),ncol=10)
mydata.y <- runif(50,50,500)
mydata.x2 <- matrix(runif(3200,-2,2),ncol=64)
mydiabetes <- data.frame(mydata.x,mydata.y,mydata.x2)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60817422

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档