文章/答案/技术大牛

发布

社区首页 >问答首页 >基于NLP的聊天室强化学习

问基于NLP的聊天室强化学习
EN

Data Science用户

提问于 2019-11-27 18:57:12

回答 2查看 152关注 0票数 0

是否有人知道任何成功实施NLP强化学习的情况。我期待的聊天机器人，可以自动学习。

试着搜索互联网，但很少发现像自然语言处理的强化学习。媒介这样的文章或像基于自然语言的强化学习综述这样的报纸。

但是它们都没有提供一个健壮的代码，这表明它是有效的。请给我建议。

nlp

reinforcement-learning

回答 2

Data Science用户

发布于 2019-11-28 01:11:07

这是因为在聊天机器人上使用NN已经被证明是极具挑战性的。基本上，一旦输入了查询，NN (无论是NN还是RL)都必须将其标记为特定的意图(基于此目的，您可以给出一个模板化的响应(生成类似人类的响应会进入更复杂的自然语言生成领域)。

像LSTM，GRU等神经网络的问题是，他们不理解谈话中的“转折”。所以，如果你一个接一个地输入一个查询，机器人就会把它们作为单独的句子来处理，然后试着把它们分别标记出来。但是一个人会在整个对话的基础上形成一个语境，并能处理转折。有几个垂直点的标签数据显示谈话中有变化，但这还不够

对于RL来说，这似乎是处理会话的一个很好的选择，因为当前状态(句子)完全取决于先前的状态。但是你想到的是什么样的奖励功能呢？基于代理的行为，网络将如何学习识别“会话”的策略？你什么时候才能停止这集？当谈话结束的时候？还是一个固定的数字？我认为这些仍然是很难解决的问题，因为在这样的用例中，收敛是一个挑战。

如果有人破解了它，他们很可能不会发表任何东西，因为一个真正的研究人员只会发表那些可以复制的东西，或者他们只是在保密:)

票数 0

Data Science用户

发布于 2022-01-02 16:30:48

一个例子是Debmalya Biswas的“基于强化学习的自我改进聊天机器人”。有一个纸和代码。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/63880

复制

相似问题

问基于NLP的聊天室强化学习
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于NLP的聊天室强化学习EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于NLP的聊天室强化学习
EN