首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >这个任务的机器学习算法?

这个任务的机器学习算法?
EN

Stack Overflow用户
提问于 2012-01-07 16:45:45
回答 3查看 316关注 0票数 1

试图编写一些处理此任务的代码:

  • 作为起点,我有大约20个“轮廓”(假设一个景观轮廓),即一维数组,大约1000个实数。
  • 每个剖面都有一个实际值的期望结果,即“有效高度”。
  • 有效高度是某种平均的,但峰的高度、宽度和位置起着特殊的作用。
  • 我的目标是从输入数据中归纳出进一步轮廓的有效高度。

f 29

有没有一种机器学习算法或原理可以帮助?

EN

回答 3

Stack Overflow用户

发布于 2013-01-09 08:03:57

原则1:提取最重要的特性,而不是向它提供所有

正如你说的,“有效高度是某种平均值,但峰的高度、宽度和位置起着特殊作用。”因此,您有一个强先验假设,,这些度量对于学习是最重要的。如果我是你,我会先计算出这些指标,然后用它们作为学习的输入,而不是原始数据。

原理2:在选择学习算法时,首先要注意的是线性可分性

假设高度是这些度量的函数,那么您必须考虑函数在多大程度上是线性。例如,如果这个函数几乎是线性的,那么一个非常简单的感知器就会是完美的。否则,如果它不是线性的,你可能想要一个多层的神经网络。如果它与linear....please相去甚远,请转到原则1,并检查您是否提取了正确的特性。

原则3:更多数据帮助

就像你说的,你有大约20个“个人资料”用于培训。一般来说,这还不够。几乎所有的机器学习算法都是为大数据而设计的。甚至他们都声称他们的算法善于学习小样本,但通常不会小到20。获得了更多的数据!

票数 2
EN

Stack Overflow用户

发布于 2012-01-07 16:52:55

也许多元线性回归就够了?

票数 0
EN

Stack Overflow用户

发布于 2013-01-09 07:11:44

我可能会结合您所说的哪些特性起着最重要的作用,然后在此基础上进行回归。基本上,您至少需要一个对应于每个特性的系数,并且需要比系数更多的数据点。所以,我会选择两个最大的山峰的高度和宽度。现在,您已经将每个配置文件减少到只有4个数字。现在做这个技巧:将数据分成5组,4组,选择前4组。将所有这些配置文件减少到4个数字,然后使用期望的结果来进行回归。一旦你训练了回归,在最后的4个点上试试你的技巧,看看它的效果如何。重复此过程5次,每次遗漏一组不同的数据。这叫做交叉验证,而且非常方便。

显然,获取更多的数据会有帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8771291

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档