首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用R读取DataSet

如何使用R读取DataSet
EN

Stack Overflow用户
提问于 2019-09-09 20:01:12
回答 1查看 184关注 0票数 0

我有3个CSV文件。train.csv -训练集,test.csv -测试集,sampleSubmission.csv -格式正确的样本提交文件。我是新来的。我不知道怎么读。这是数据集的驱动链接。

https://drive.google.com/open?id=1YPw-MPlW7g2y19GT1ITy_fHbjrKBNc-M

EN

回答 1

Stack Overflow用户

发布于 2019-09-09 21:58:44

关于你的评论,我认为你必须使用额外的文件将决策树的结果放在那里。下面给出了一个简短的注释方法。

代码语言:javascript
复制
dTest  <- read.csv("test.csv")  #Read in the datasets
dTrain  <- read.csv("train.csv")
dSub  <- read.csv("sub.csv")

dTrain$y <- as.logical(dTrain$y) #Change type of y to logical

library(rpart)
dtree <- rpart(y ~ . - id, data=dTrain) #Make decission tree

all(dSub$id == dTest$id) #Test of order of dSub$id is equal to dTest$id
#[1] TRUE

dSub$y  <- predict(dtree, newdata=dTest) #make prediction
head(dSub)
#     id          y
#1 38062 0.05454481
#2 40079 0.05454481
#3 39238 0.21288164
#4 36069 0.05454481
#5 40531 0.05454481
#6 38164 0.21288164
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57853623

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档