维基百科:
主动学习是机器学习的一种特例,在这种情况下,学习算法可以交互地查询用户(或其他一些信息源),用期望的输出标记新的数据点。强化学习( Reinforcement,RL)是机器学习的一个领域,它关注的是软件agents应该如何在环境中采取行动,以最大化累积报酬的概念。
如何区分他们?确切的区别是什么?
发布于 2020-11-13 14:14:08
主动学习是一种应用于监督学习设置的技术。在监督学习范式中,通过提供输入和预期输出(标签)来训练系统。该系统学习模拟培训数据,理想地将其推广到不可见但可外推的情况。主动学习通常应用于获取标签昂贵的情况下,因此我们动态地获得新的标签,定义了一种算法策略来最大化新数据点的有用性。
强化学习是一种不同的模式,我们没有标签,因此不能使用监督学习。而不是标签,我们有一个“强化信号”,告诉我们“有多好”的系统目前的输出正在接受培训。因此,在强化学习中,系统(理想的)学习策略,以获得尽可能好的回报。
发布于 2020-11-13 13:31:44
主动学习是基于这一概念的,如果一个学习算法能够选择它想要学习的数据,它可以比传统的训练数据少得多的方法取得更好的效果。这是一种半监督的机器学习。
强化学习是一种机器学习技术,它使agent能够在交互环境中通过尝试和错误学习,利用自身的行为和经验反馈。它以奖惩机制为基础,既可以是主动的,也可以是被动的。
在被动RL的情况下,代理人的策略是固定的,这意味着它被告知该做什么。与此相反,在active RL中,代理需要决定要做什么,因为它没有固定的策略可以执行。因此,被动RL agent的目标是执行固定策略(动作序列)并对其进行评估,而主动RL agent的目标是执行和学习最优策略。
因此,主动学习更像是一个概念,RL是解决问题的一种方法,如本纸所示。
参考文献:
https://datascience.stackexchange.com/questions/85358
复制相似问题