搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

我应该如何建模/设计这些聚合？

我是新的DDD，我正在尝试模型/设计以下领域的聚合。包括扶持要素和重点领域的评估模型(AM)。EEs还包含通用流程(GPs)。评估(As)包含EE子评估(EESA)、FA子评估(FASA)和GP子评估(GPSA)。区域不变量是： AM中GPs的总权重必须等于100。我想把评估模型和评估</e

浏览 0修改于2021-08-10得票数 0

1回答

假设我们已经训练了一个模型(由它的超参数定义)，并使用某种性能度量(比如R^2)在测试集上对它进行了评估。如果我们现在在不同的训练数据上训练相同的模型(由它的超参数定义)，我们将得到(可能) R^2的不同值。如果R^2依赖于训练集，那么我们将获得R^2平均值附近的正态分布。因此，为了更好地了解模型的性能，不应该将各种评估中的R^2平均化吗？另外，为什么在报告模型差异的性能时不包括？这不也是评估模型

浏览 0提问于2022-04-14得票数 1

1回答

Logistic回归绩效评价指标

我建立了一个Logistic回归模型，并对模型的性能进行了评估。我想了解它的评估指标。度量的敏感性、特异性、假阳性率、精确性、召回性和准确性能告诉我们关于这个模型的哪些信息？

浏览 0修改于2019-03-06得票数 1

回答已采纳

1回答

模型性能估计中交叉验证的有效性

当应用交叉验证来估计预测模型的性能时，所报告的性能通常是所有验证折叠上的平均性能。由于在此过程中，创建了多个模型，必须选择一个模型作为实际用于预测真实世界样本的模型(例如在产品中)。我想知道，将验证性能报告为最终(选定)模型的估计性能是否真的有效(因为性能是使用在验证过程中创建的所有其他模型导出的，但在使用最终模型进行预测时不考虑)。我预计所选模型</em

浏览 0修改于2019-09-07得票数 1

回答已采纳

1回答

在python的最终模型培训中，我可以使用从R中调优获得的超参数吗？

我目前正在为一个数据集创建和评估几个模型。一旦获得了最优参数，我能用这些参数来训练python中完整数据的最终模型吗？

浏览 0提问于2022-07-28得票数 0

回答已采纳

1回答

在多个种子上使用K-折叠交叉验证来评估模型的正确方法是什么？

我正在训练一个深度学习模型，使用3个随机种子上的5倍CV (随机种子用于模型初始化，CV拆分一次)。对于每个折叠，我保存最好的模型。因此，在模拟之后，我得到了15个模型。为了评估性能，我取了这15个模型中的最好的(在整个评估过程中没有变化)，并使用每个种子的所有5折的验证折叠来对其进行评估。然后我对这些种子的结果进行平均。我想知道我在这里做的事情是否正确。我已经读到有两种方法来计算CV性能:1池化，其中性能

浏览 28修改于2020-01-10得票数 0

1回答

我如何知道我的回归模型是否不合适？

在不存在领域知识性能度量的情况下，如何评估具有特定RMSE的回归模型的性能？也许MAPE是一种比较我的模型在我的数据集上的性能和另一个模型在另一个但类似的数据集上的性能的方法。有任何方法来评估我的训练模型的性能，给出总结统计和RMSE值吗？这是否意味着我的模型“足够好”？我的意思是，我怎么能确定我的模型不适合这些数据？

浏览 0修改于2023-03-30得票数 0

1回答

Rattle R package:评估logistic回归模型和决策树模型的模型性能的最佳指标是什么？

我有一个数据集需要在两个模型中进行评估:逻辑回归和决策树。评估这两个模型性能的最佳指标是什么？

浏览 3提问于2015-03-10得票数 0

1回答

如何在大型数据集的特定切片上评估TensorFlow模型的性能？

如何在大型评估数据集的特定片(段)上评估我的TensorFlow模型的性能？

浏览 3修改于2018-03-30得票数 0

回答已采纳

1回答

如果我不关心对新数据的准确性的不偏不倚的估计，我是否需要一个测试集？

简言之：测试集-获得对新数据的模型性能的无偏估计。我理解，在许多情况下，您希望对模型性能进行公正的评估，例如，发布论文或向客户报告结果。但是，在我的情况下，我不关心获得一个对新数据的模型性能的公正估计。我只想找到最好的模型并使用它。除了对模型性能的不偏不倚的评估外，还有什么

浏览 0提问于2018-03-07得票数 1

3回答

在深度强化学习中，神经网络的设计是否有经验法则？

在深入学习中，我们可以用损失函数值来评估模型的性能，并通过K倍交叉验证等方法来提高模型的性能。但是，如何设计和优化神经网络在深度强化学习中的应用呢？我们可以用奖励等来评估强化学习算法本身的性能，但是如何保证神经网络在强化学习算法中的应用是好的还是坏的呢？

浏览 0提问于2019-02-08得票数 3

1回答

选择合适的回归模型度量

我知道有几个评估指标，我读过几篇关于它的文章。因为我还是机器学习的初学者。我还是很困惑从这个中可以看出，了解数据的分布和业务目标有助于我们理解如何选择合适的度量标准。这

浏览 3修改于2020-03-26得票数 2

回答已采纳

0回答

贝叶斯结构时间序列模型（BSTS）模型性能如何让评估？

机器学习、神经网络、深度学习、人工智能

贝叶斯结构时间序列模型（BSTS）模型性能如何让评估？

浏览 186提问于2022-08-11

1回答

为什么从10倍交叉验证中得到的模型性能分数存在巨大差异？

我使用的是梯度增强回归模型 (GBRT)。为了评估这个模型，我使用了10倍交叉验证，在每个中我都设置了相同的参数，因此唯一的区别就是训练和测试数据集。为什么会有这么大的差异？这样的差异是否表明我的模型的性能不好？

浏览 2提问于2014-09-12得票数 0

回答已采纳

1回答

类似恶意软件检测问题的真实性能评价

我有一个问题，如何评估模型的性能类似于恶意软件检测在现实世界中。例如，我创建了一个恶意软件检测模型来预测引擎是否会停机。而且这个模型似乎做得不错，所以我把它推向了生产。然而，在现实世界中，当模型预测引擎会熄火时，我会派人去修理它。棘手的部分是，我正在做的预防措施，派人去修理发动机之前，它已经关闭。有什么好的方法来评估模型的性能吗？谢谢!

浏览 0提问于2020-04-16得票数 0

3回答

比较经典时间序列预测方法(ARIMA/Prophet)与ML方法的最佳通用度量？

我是时间序列预测的新手，我希望将ARIMA/Prophet模型与基于历史股票市场数据和社交媒体情绪评分的XGBoost模型进行比较，预测未来的股票市场价值。我更熟悉机器学习，所以通常会使用像R^2这样的评估指标来评估这类问题的模型性能。是否有像ARIMA/Prophet这样的预测方法来评估它们的准确性，这样我就可以和XGBoost的预测精度做类似的比较了吗？

浏览 0修改于2021-08-11得票数 3

1回答

在K倍交叉验证中，最终测试集的意义是什么？

我正在对我的二元分类问题进行logistic回归，并使用k折叠交叉验证(k=10)对模型进行了验证。但是，我不明白为什么我需要一个最终的测试集:模型的性能不能基于k折叠验证(即，来自10个结果折叠的度量标准)进行评估吗？因为，模型没有真正“看到”测试数据，这不是K折叠的全部要点吗？还是从10倍中的每一次提供的性能度量都足以评估模型的性能？

浏览 0提问于2023-04-23得票数 0

2回答

为什么超参数调优发生在验证数据集上，而不是在一开始？

据我所知，我选择一个模型，对训练数据进行训练，对训练数据进行性能评估，然后对验证数据进行超参数整定评估模型性能，然后选择最佳模型并对测试数据进行测试。为了做到这一点，我基本上需要随机选择一个模型来训练数据。我不明白的是，我不知道哪一种模式在一开始会是最好的。假设我认为神经网络和随机森林可能对我的问题有用。那么，为什么我不开始搜索一个一般的，例如，神经网络体系结构，随机森林体系结构，并从一开始，评估哪一个模型是最好的一

浏览 0提问于2022-05-28得票数 0

1回答

是否可以将两个预测建模案例(特征重叠)的训练集组合起来？

由于这两个数据集都很小，它们各自的预测模型的性能不太好。为了提高预测性能，我可以/应该应用以下步骤吗？删除不常见的列(因此A、B和E列保留在两个数据集中)基于D1和D2训练集组合的预测模型的训练我认为这是允许的，但我不能完全确定是否有任何(坏的)影响。

浏览 0提问于2020-06-21得票数 2

1回答

无标记数据上变分自动编码器性能的评价

为了评估VAE在标记数据上的性能，首先对原始数据运行KMeans，并使用调整的互信息评分(AMI)将生成的标签与真正的标签进行比较。然后，在对模型进行训练后，将验证数据传递给它，在潜在向量上运行KMeans，并将生成的标签与使用AMI的验证数据的真实标签进行比较。最后，我比较了两个AMI的得分，看看KMeans在潜在向量上的性能是否优于原始数据。我的问题是:当数据未被标记时，我们如何评估VAE的性能？我知道我们可以在原始数据上运行KMeans并为其生成标签，但是在这种情况下，既然我们认

浏览 8修改于2022-09-24得票数 -1

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

我应该如何建模/设计这些聚合？

偏差-方差权衡与模型评估

Logistic回归绩效评价指标

模型性能估计中交叉验证的有效性

在python的最终模型培训中，我可以使用从R中调优获得的超参数吗？

在多个种子上使用K-折叠交叉验证来评估模型的正确方法是什么？

我如何知道我的回归模型是否不合适？

Rattle R package:评估logistic回归模型和决策树模型的模型性能的最佳指标是什么？

如何在大型数据集的特定切片上评估TensorFlow模型的性能？

如果我不关心对新数据的准确性的不偏不倚的估计，我是否需要一个测试集？

在深度强化学习中，神经网络的设计是否有经验法则？

选择合适的回归模型度量

贝叶斯结构时间序列模型（BSTS）模型性能如何让评估？

为什么从10倍交叉验证中得到的模型性能分数存在巨大差异？

类似恶意软件检测问题的真实性能评价

比较经典时间序列预测方法(ARIMA/Prophet)与ML方法的最佳通用度量？

在K倍交叉验证中，最终测试集的意义是什么？

为什么超参数调优发生在验证数据集上，而不是在一开始？

是否可以将两个预测建模案例(特征重叠)的训练集组合起来？

无标记数据上变分自动编码器性能的评价

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐