
我第一次尝试RF。我正在尝试根据这些因素来预测游戏的类型。
data <- read.csv("appstore_games.csv")
data <- data %>% drop_na()
data <- data %>% select(Average.User.Rating, User.Rating.Count, Price, Age.Rating, Genres)
data <- data %>% separate(Genres, c("Main Genre","Genre1","Genre2","Genre3"), extra = "drop" )
data1 <- data %>% select(Genre1 , Average.User.Rating, User.Rating.Count, Price )
str(data1)
data1$Genre1 <- as.factor(data1$Genre1)
set.seed(123)
sample <- sample(2 , nrow(data1),replace = TRUE, prob = c(0.7,0.3))
train_data <- data1[sample == 1,]
test_data <- data1[sample == 2,]
library(randomForest)
set.seed(1)
rf <- randomForest(train_data$Genre1 ~., data = train_data , proximity = TRUE, ntree = 200, importance = TRUE)它在randomForest.default(m,y,...)中显示错误: y中不能有空类。
我能知道这里出了什么问题吗?感谢类型的名称,如策略,娱乐,等等
发布于 2020-05-01 22:20:28
我不完全确定,但我认为如果不是所有不同级别的Y都在训练数据中表示,这种情况可能会发生。也许你可以看看这个。
我的另一个想法是,Y中的一个类是"None“。
发布于 2020-05-07 02:49:25
train_data <- droplevels(train_data)在将数据传递给模型之前尝试使用此命令
https://stackoverflow.com/questions/61543696
复制相似问题