试图编写一些处理此任务的代码:
f 29
有没有一种机器学习算法或原理可以帮助?
发布于 2013-01-09 08:03:57
原则1:提取最重要的特性,而不是向它提供所有
正如你说的,“有效高度是某种平均值,但峰的高度、宽度和位置起着特殊作用。”因此,您有一个强先验假设,,这些度量对于学习是最重要的。如果我是你,我会先计算出这些指标,然后用它们作为学习的输入,而不是原始数据。
原理2:在选择学习算法时,首先要注意的是线性可分性。
假设高度是这些度量的函数,那么您必须考虑函数在多大程度上是线性。例如,如果这个函数几乎是线性的,那么一个非常简单的感知器就会是完美的。否则,如果它不是线性的,你可能想要一个多层的神经网络。如果它与linear....please相去甚远,请转到原则1,并检查您是否提取了正确的特性。
原则3:更多数据帮助
就像你说的,你有大约20个“个人资料”用于培训。一般来说,这还不够。几乎所有的机器学习算法都是为大数据而设计的。甚至他们都声称他们的算法善于学习小样本,但通常不会小到20。获得了更多的数据!
发布于 2012-01-07 16:52:55
也许多元线性回归就够了?
发布于 2013-01-09 07:11:44
我可能会结合您所说的哪些特性起着最重要的作用,然后在此基础上进行回归。基本上,您至少需要一个对应于每个特性的系数,并且需要比系数更多的数据点。所以,我会选择两个最大的山峰的高度和宽度。现在,您已经将每个配置文件减少到只有4个数字。现在做这个技巧:将数据分成5组,4组,选择前4组。将所有这些配置文件减少到4个数字,然后使用期望的结果来进行回归。一旦你训练了回归,在最后的4个点上试试你的技巧,看看它的效果如何。重复此过程5次,每次遗漏一组不同的数据。这叫做交叉验证,而且非常方便。
显然,获取更多的数据会有帮助。
https://stackoverflow.com/questions/8771291
复制相似问题