使用更新规则w_i=w_i + n(y-\hat{y})x可以很容易地完成对Percep撕裂的学习。
到目前为止,我所读到的所有资源都说,学习速率n可以设置为1w.l.g。
我的问题是,考虑到数据是线性可分的,是否有证据证明收敛速度总是相同的?这不也取决于初始w向量吗?
发布于 2014-05-16 21:54:05
引用维基百科
感知器的决策边界相对于权向量的标度是不变的,即用初始权向量\mathbf{w}和学习速率α训练的感知器与初始权向量mathbf{w}/\alpha \和学习速率1训练的感知器的行为相同。因此,由于初始权值随迭代次数的增加而变得无关,所以在感知器的情况下,学习速率并不重要,通常只是设置为1。
https://stackoverflow.com/questions/23674971
复制相似问题