我正在做一个交通流量预测,我可以预测一个地方有繁忙或轻微的交通。我将每个流量分类为1-5,1是最轻的流量,5是最大的流量。
我偶然看到这个网站,http://www.waset.org/journals/waset/v25/v25-36.pdf,AdaBoost算法,我真的很难学习这个算法。特别是在S是集合((xi,yi),i=(1,2,…,m))的部分。Y={-1,+1}在哪里。什么是x、y和常量L?L的价值是什么
谁能给我解释一下这个算法?:)
发布于 2012-08-06 19:55:22
S={(x1,y1),...,(xm,ym)}:每个(x,y)对都是用于训练(或测试)分类器的样本:
x =描述此特定样本的要素,例如列出etcy、1, 2, 3, 4 or 5、amount of cars on the road的值day of the week =特定x的标签,在本例中可以是标签
白皮书中的Table 1显示了他们使用的x功能,即:DAY、TIME、INT、DET、LINK、POS、GRE、<代码>D23、<代码>D24和<代码>D25。表的最后一列显示标签(y),他们将其设置为1或-1 (即yes或no)。表中的每一行都是一个样本。
L是AdaBoost训练弱学习者的轮数(在本文中,Random Forests用作弱分类器)。如果将L设置为1,则AdaBoost将运行1轮,并且仅训练1个弱分类器,这将产生糟糕的结果。使用不同的L值执行多个实验,以找到最佳值(即,当AdaBoost收敛或开始过拟合时)。
https://stackoverflow.com/questions/11825493
复制相似问题