文章/答案/技术大牛

发布

社区首页 >问答首页 >组合多个模型的结果

问组合多个模型的结果
EN

Data Science用户

提问于 2018-10-20 18:02:47

回答 3查看 375关注 0票数 1

我一次使用CSV文件中的100000行块来训练一个简单的LASSO模型。

我如何组合所有这些模型从这些不同的块训练？我想用所有这些经过训练的模型来预测。

我很熟悉达斯克和其他替代品，但我想使用潘达斯。

pipelines = {
    'lasso' : make_pipeline(StandardScaler(), Lasso(random_state=123))
}

for key, value in pipelines.items():
    print( key, type(value) )

# Lasso hyperparameters
lasso_hyperparameters = { 
    'lasso__alpha' : [0.001, 0.005, 0.01, 0.05, 0.1, 0.5, 1, 5, 10] 
}

hyperparameters = {
'lasso' : lasso_hyperparameters
}

# Create empty dictionary called fitted_models
fitted_models = {}

# Create cross-validation object from pipeline and hyperparameters
model = GridSearchCV(pipeline, hyperparameters[name], cv=10, n_jobs=-1)

def train(X_train, y_train):  
    # Fit model on X_train, y_train
    model.fit(X_train, y_train)

    # Store model in fitted_models[name] 
    fitted_models[name] = model

    # Print '{name} has been fitted'
    print(name, 'has been fitted.')
    print ("__________________________________")
    print (model.cv_results_)


for df in pd.read_csv('train_V2.csv', chunksize=100000):
    df = df.dropna()
    df = pd.get_dummies(df, columns=['matchType'])
    df_train = df.drop(['Id', 'groupId', 'matchId'], axis = 1)
    y = df_train.winPlacePerc       
    X = df_train.drop('winPlacePerc', axis=1)
    X_train, X_test, y_train, y_test = train_test_split(X, y, 
                                                    test_size=0.2, 
                                                    random_state=1234)
    X_train = np.asarray(X_train)
    X_test = np.asarray(X_test)
    y_train = np.asarray(y_train)
    y_test = np.asarray(y_test)

    train(X_train, y_train)

machine-learning

python

pandas

machine-learning-model

回答 3

Data Science用户

发布于 2018-10-20 18:58:07

你正在寻找的是所谓的“随机优化”。您不需要安装单独的模型，然后将它们组合起来。

票数 0

Data Science用户

发布于 2022-08-21 23:50:01

考虑使用sklearn.linear_model.SGDRegressor和L1惩罚，这相当于拉索。

这有一个.partial_fit实现，可以用块数据集增量地训练模型，而不是训练单独的模型。

例如。

for epoch in epochs:
    for df in pd.read_csv('train_V2.csv', chunksize=100000):
        model.partial_fit(*args)

票数 0

Data Science用户

发布于 2023-05-21 23:36:01

你可以有两个方法：

要么您将所有模型集合到一个投票回归者中。
你逐渐地训练你的模型

考虑到您的用例，我会进行增量式的培训。然而，并不是所有的科学学习模型都支持增量式培训。您可以检查支持增量在这里训练的分类器列表。

由于您使用的是一个简单的拉索模型，您可以与SDGRegressor与L1正则化。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/39985

复制

相似问题

问组合多个模型的结果
EN

回答 3

Data Science用户

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问组合多个模型的结果EN

回答 3

Data Science用户

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问组合多个模型的结果
EN