是否有人知道任何成功实施NLP强化学习的情况。我期待的聊天机器人,可以自动学习。
试着搜索互联网,但很少发现像自然语言处理的强化学习。媒介这样的文章或像基于自然语言的强化学习综述这样的报纸。
但是它们都没有提供一个健壮的代码,这表明它是有效的。请给我建议。
发布于 2019-11-28 01:11:07
这是因为在聊天机器人上使用NN已经被证明是极具挑战性的。基本上,一旦输入了查询,NN (无论是NN还是RL)都必须将其标记为特定的意图(基于此目的,您可以给出一个模板化的响应(生成类似人类的响应会进入更复杂的自然语言生成领域)。
像LSTM,GRU等神经网络的问题是,他们不理解谈话中的“转折”。所以,如果你一个接一个地输入一个查询,机器人就会把它们作为单独的句子来处理,然后试着把它们分别标记出来。但是一个人会在整个对话的基础上形成一个语境,并能处理转折。有几个垂直点的标签数据显示谈话中有变化,但这还不够
对于RL来说,这似乎是处理会话的一个很好的选择,因为当前状态(句子)完全取决于先前的状态。但是你想到的是什么样的奖励功能呢?基于代理的行为,网络将如何学习识别“会话”的策略?你什么时候才能停止这集?当谈话结束的时候?还是一个固定的数字?我认为这些仍然是很难解决的问题,因为在这样的用例中,收敛是一个挑战。
如果有人破解了它,他们很可能不会发表任何东西,因为一个真正的研究人员只会发表那些可以复制的东西,或者他们只是在保密:)
https://datascience.stackexchange.com/questions/63880
复制相似问题