文章/答案/技术大牛

发布

社区首页 >问答首页 >是否有可能获得MLPClassifier每次迭代的测试分数？

问是否有可能获得MLPClassifier每次迭代的测试分数？
EN

Stack Overflow用户

提问于 2017-10-24 22:02:00

回答 2查看 14.2K关注 0票数 15

我想并排查看训练数据和测试数据的损失曲线。目前，使用clf.loss_curve获得每次迭代的训练集损失似乎很简单(见下文)。

from sklearn.neural_network import MLPClassifier
clf = MLPClassifier()
clf.fit(X,y)
clf.loss_curve_ # this seems to have loss for the training set

然而，我也想在一个测试数据集上绘制性能图。这个可以用吗？

python

scikit-learn

neural-network

回答 2

Stack Overflow用户

发布于 2017-10-24 22:40:13

clf.loss_curve_不是API-docs的一部分(尽管在某些示例中使用了它)。它存在的唯一原因是因为它在内部用于提前停止。

正如Tom提到的，还有一些使用validation_scores_的方法。

除此之外，更复杂的设置可能需要进行更手动的培训，在这种方式下，您可以控制何时、什么以及如何测量某些东西。

在阅读了汤姆的答案后，明智的做法可能是:如果只需要跨纪元计算，他将warm_start和max_iter结合在一起的方法节省了一些代码(并使用了更多的sklearn的原始代码)。这里的代码也可以进行纪元内计算(如果需要；与keras比较)。

简单的(原型)示例：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_mldata
from sklearn.neural_network import MLPClassifier
np.random.seed(1)

""" Example based on sklearn's docs """
mnist = fetch_mldata("MNIST original")
# rescale the data, use the traditional train/test split
X, y = mnist.data / 255., mnist.target
X_train, X_test = X[:60000], X[60000:]
y_train, y_test = y[:60000], y[60000:]

mlp = MLPClassifier(hidden_layer_sizes=(50,), max_iter=10, alpha=1e-4,
                    solver='adam', verbose=0, tol=1e-8, random_state=1,
                    learning_rate_init=.01)

""" Home-made mini-batch learning
    -> not to be used in out-of-core setting!
"""
N_TRAIN_SAMPLES = X_train.shape[0]
N_EPOCHS = 25
N_BATCH = 128
N_CLASSES = np.unique(y_train)

scores_train = []
scores_test = []

# EPOCH
epoch = 0
while epoch < N_EPOCHS:
    print('epoch: ', epoch)
    # SHUFFLING
    random_perm = np.random.permutation(X_train.shape[0])
    mini_batch_index = 0
    while True:
        # MINI-BATCH
        indices = random_perm[mini_batch_index:mini_batch_index + N_BATCH]
        mlp.partial_fit(X_train[indices], y_train[indices], classes=N_CLASSES)
        mini_batch_index += N_BATCH

        if mini_batch_index >= N_TRAIN_SAMPLES:
            break

    # SCORE TRAIN
    scores_train.append(mlp.score(X_train, y_train))

    # SCORE TEST
    scores_test.append(mlp.score(X_test, y_test))

    epoch += 1

""" Plot """
fig, ax = plt.subplots(2, sharex=True, sharey=True)
ax[0].plot(scores_train)
ax[0].set_title('Train')
ax[1].plot(scores_test)
ax[1].set_title('Test')
fig.suptitle("Accuracy over epochs", fontsize=14)
plt.show()

输出：

或者更紧凑一些：

plt.plot(scores_train, color='green', alpha=0.8, label='Train')
plt.plot(scores_test, color='magenta', alpha=0.8, label='Test')
plt.title("Accuracy over epochs", fontsize=14)
plt.xlabel('Epochs')
plt.legend(loc='upper left')
plt.show()

输出：

票数 12

Stack Overflow用户

发布于 2017-10-24 22:36:18

使用MLPClassifier(early_stopping=True)，停止标准从训练损失变为准确率得分，这是在验证集(其大小由参数validation_fraction控制)上计算的。

每次迭代的验证分数都存储在clf.validation_scores_中。

另一种可能性是将warm_start=True与max_iter=1一起使用，并在每次迭代后手动计算您想要监控的所有数量。

票数 9

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46912557

复制

相似问题

问是否有可能获得MLPClassifier每次迭代的测试分数？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否有可能获得MLPClassifier每次迭代的测试分数？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否有可能获得MLPClassifier每次迭代的测试分数？
EN