作为硕士论文的一部分,我用机器学习的方法对数据进行了预测,但目前还没有论文。该主题是一个回归问题,已经对几种机器学习方法进行了测试:SVR, RandomForestRegressor, GradientBoosting, DecisionTrees, Artificial Neural Networks, LSTMs, K-NearestNeighbors。
已经证明,所有的方法都可以取得有益的结果。哪种方法是最好的,在很大程度上取决于参数配置。
要测试任何方法的任何参数配置都需要做太多的工作。此外,我认为显示数十幅关于参数优化测试的图表将是毫无意义的,因为它们也严重依赖于各自的数据集。
那么,在严重依赖于参数的科学论文中,通常如何比较不同类型的机器学习方法呢?只需玩一点网格搜索和随机搜索,直到您满意的参数配置?
发布于 2018-05-06 13:04:07
如果我理解,您可以根据使用正确的预处理、选择正确的特性、构建适当的体系结构(选择最适合问题的模型)的努力来评估您的方法。
每一步都会使损失减少,直到你到达一个点,你将不得不搜索超参数来压缩每一个百分比的准确性,这是一个严重的计算问题。
发布于 2018-02-05 10:35:49
你好,我不知道科学论文的事。
但是我知道要比较ML算法的质量,你需要建立一个度量:把它变成一个正方形的误差或其他任何东西,一个最终的数字,可以告诉你你的算法是否像预期的那样工作。
顺便提一句:每种算法,如果用于正确的目的,都是高度依赖于参数的。所以我不知道你说的是什么“机器学习方法严重依赖于参数”
https://datascience.stackexchange.com/questions/27466
复制相似问题