首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在线学习w/特征加权/调整

在线学习w/特征加权/调整
EN

Data Science用户
提问于 2017-01-04 17:48:59
回答 2查看 134关注 0票数 1

假设我有一个有监督的学习问题,有一系列的特征和标签。首先,我学习的培训数据,然后我决定流的数据,逐点和做在线学习。是否有可能在每个数据点进入时更新权重或计算特性重要性?另外,什么在线学习算法可以让我做到这一点,这可以用Python完成吗?

EN

回答 2

Data Science用户

回答已采纳

发布于 2017-01-05 05:54:35

在线学习实际上是一种处理海量数据和海量特征空间的优化方法。

FTRL是由随机梯度下降导出的一种典型算法。如果你想知道更多关于这方面的信息,你可以参考纸张http://www.jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf

在此基础上开发了其他具体的在线方法,如TDAP,您可以查看纸质http://www.cs.cmu.edu/~epxing/papers/2016/HuaWei_KDD16.pdf来了解更多信息。

就像你说的,你想在训练时了解“特征重要性”。当迭代继续或数据点进入时,模型会改变,因此模型会告诉您确切的“特性重要性”。

在这种情况下,它们大多是用scala或基于Spark的java开发的,其他的可能是使用基于OMP的c++开发的,您可以使用python开发自己的在线学习方法。

希望这对你有帮助-)

票数 0
EN

Data Science用户

发布于 2017-01-04 22:05:04

是的,这可以用Python来完成。Scikit- learning有一些在线学习算法,您可以从中获得特性的重要性。请看6.1.3下的以下网页。增量学习:

http://scikit-learn.org/stable/modules/scaling_strategies.html

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/16073

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档