我有3个CSV文件。train.csv -训练集,test.csv -测试集,sampleSubmission.csv -格式正确的样本提交文件。我是新来的。我不知道怎么读。这是数据集的驱动链接。
https://drive.google.com/open?id=1YPw-MPlW7g2y19GT1ITy_fHbjrKBNc-M
发布于 2019-09-09 21:58:44
关于你的评论,我认为你必须使用额外的文件将决策树的结果放在那里。下面给出了一个简短的注释方法。
dTest <- read.csv("test.csv") #Read in the datasets
dTrain <- read.csv("train.csv")
dSub <- read.csv("sub.csv")
dTrain$y <- as.logical(dTrain$y) #Change type of y to logical
library(rpart)
dtree <- rpart(y ~ . - id, data=dTrain) #Make decission tree
all(dSub$id == dTest$id) #Test of order of dSub$id is equal to dTest$id
#[1] TRUE
dSub$y <- predict(dtree, newdata=dTest) #make prediction
head(dSub)
# id y
#1 38062 0.05454481
#2 40079 0.05454481
#3 39238 0.21288164
#4 36069 0.05454481
#5 40531 0.05454481
#6 38164 0.21288164https://stackoverflow.com/questions/57853623
复制相似问题