我正在使用RandomForestClassifier方法进行物体检测,问题是,即使我知道我的随机状态应该是0作为默认值,我得到了非常糟糕的准确性,所以无论如何,有没有知道我的n_estimators,random_state参数的最佳值是什么?
from sklearn.ensemble import RandomForestClassifier
RF_model = RandomForestClassifier(n_estimators = 250, random_state = 120)发布于 2020-12-18 12:22:14
要确定模型的最佳参数,可以使用称为网格搜索的过程。Sklearn提供了一个用于执行此操作的类GridSearchCV。我已经提供了如何将其用于随机森林分类器的代码示例。
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
# provide iterables of values to be tested each parameter
parameters = {'n_estimators': [100, 250, 500, 750]}
clf = GridSearchCV(RandomForestClassifier(), parameters)
clf.fit(X, y) # X and y are your training data and targets值得注意的是,在您的问题中,您特别提到要为n_estimators和random_state参数寻找最佳值。我没有将random_state作为GridSearch的一部分,因为该参数通常是为了结果的重现性而存在。下面是Sklearns Glossary中关于该参数的一些additonal reading。
https://stackoverflow.com/questions/65349290
复制相似问题