尝试通过tensorflow和FTRL优化器针对ctr任务在大规模数据集上训练LR模型。但是产品的性能并不好。有什么建议吗?
发布于 2018-08-13 11:34:30
至少找到两个原因:
首先是底层实现与原始论文不完全相同。我不知道他们为什么这样做,需要解释。
其次,更新权重时使用的梯度是批量梯度,这意味着每批更新一次ps权重(在现代分布式系统中非常琐碎,但不适合原始论文中的场景),总之,它不会以记录的方式利用训练数据。就我个人而言,第二个是关键点。
https://stackoverflow.com/questions/51096891
复制相似问题