我正在训练一个逻辑回归算法,它为每次迭代返回以下信息。我收集这些实体作为整个分类的数组。
你能给我一些可视化的方法吗?例如,绘制损失与准确性的关系是否合适?或者我应该使用哪种图形类型?
***** Iteration #74 *****
Loss: 170.07
Feature L2-norm: 12.5714
Learning rate (eta): 0.00778819
Total number of feature updates: 236800
Loss variance: 5.01839
Seconds required for this iteration: 0.01
Accuracy: 0.9800 (784/800)
Micro P, R, F1: 0.9771 (384/393), 0.9821 (384/391), 0.9796
***** Iteration #75 *****
Loss: 166.81
Feature L2-norm: 12.4385
Learning rate (eta): 0.00769234
Total number of feature updates: 240000
Loss variance: 4.68113
Seconds required for this iteration: 0.01
Accuracy: 0.9800 (784/800)
Micro P, R, F1: 0.9771 (384/393), 0.9821 (384/391), 0.9796发布于 2011-10-24 06:42:17
发布于 2011-10-24 17:43:54
我认为你不应该把这些信息形象化。所有你能看到的是L2范数随着时间的推移而减少(因为它是目标最小化函数),并且准确度提高了。但由于F1如此之高,我认为它是对训练数据进行评估的指标。因此,我建议在测试数据(不用于训练的数据)上做Micro P,R,F1: 0.9771 (384/393),0.9821 (384/391),0.9796这样的报告,并创建迭代与F1的关系图。然后,您将看到何时在曲线图上开始逐个峰值地过拟合数据。
https://stackoverflow.com/questions/7869465
复制相似问题