我正在尝试使用multi:softmax objective训练xgboost模型,但准确性得分卡住了。
代码:
#preparing dataset omitted
xgb_params = {
"objective": "multi:softmax",
"eta": 1,
"num_class": 62,
"max_depth": 10,
"nthread": 4,
"eval_metric": "merror",
"print.every.n": 1,
"silent": 1,
"early.stop.round": 5
}
num_rounds = 5
mask = np.random.choice([False, True], len(X_train), p=[0.5, 0.5])
not_mask = [not i for i in mask]
dtrain = xgb.DMatrix(X_train[not_mask], label=y[not_mask])
dtrain_watch = xgb.DMatrix(X_train[mask], label=y[mask])
dtest = xgb.DMatrix(X_test)
watchlist = [(dtrain_watch, 'eval')]
gbdt = xgb.train(xgb_params, dtrain, num_rounds, watchlist)
preds = gbdt.predict(dtest)输出:
[0] eval-merror:0.989950
[1] eval-merror:0.989950
[2] eval-merror:0.989950
[3] eval-merror:0.989950
[4] eval-merror:0.989950我需要更改哪些参数来反映迭代中的任何更改eval-merror?
编辑:我已经尝试将eta更改为0.01,0.1,0.3和1,但都是徒劳的。
发布于 2018-02-06 19:58:16
我认为这不是关于参数,而是关于你的数据。
根据新的问题,您可以通过使用不同的数据集(例如kaggle )来测试它,并构建一个类似于此的模型,但可能使用不同的"num_class": x。
发布于 2018-02-08 23:20:42
您可以使用sklearn GridSearchCV进行参数调整。但是如果你没有时间,那就增加early.stop.round和max_depth,降低eta
https://stackoverflow.com/questions/32390676
复制相似问题