首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于NLP的聊天室强化学习

基于NLP的聊天室强化学习
EN

Data Science用户
提问于 2019-11-27 18:57:12
回答 2查看 152关注 0票数 0

是否有人知道任何成功实施NLP强化学习的情况。我期待的聊天机器人,可以自动学习。

试着搜索互联网,但很少发现像自然语言处理的强化学习。媒介这样的文章或像基于自然语言的强化学习综述这样的报纸。

但是它们都没有提供一个健壮的代码,这表明它是有效的。请给我建议。

EN

回答 2

Data Science用户

发布于 2019-11-28 01:11:07

这是因为在聊天机器人上使用NN已经被证明是极具挑战性的。基本上,一旦输入了查询,NN (无论是NN还是RL)都必须将其标记为特定的意图(基于此目的,您可以给出一个模板化的响应(生成类似人类的响应会进入更复杂的自然语言生成领域)。

像LSTM,GRU等神经网络的问题是,他们不理解谈话中的“转折”。所以,如果你一个接一个地输入一个查询,机器人就会把它们作为单独的句子来处理,然后试着把它们分别标记出来。但是一个人会在整个对话的基础上形成一个语境,并能处理转折。有几个垂直点的标签数据显示谈话中有变化,但这还不够

对于RL来说,这似乎是处理会话的一个很好的选择,因为当前状态(句子)完全取决于先前的状态。但是你想到的是什么样的奖励功能呢?基于代理的行为,网络将如何学习识别“会话”的策略?你什么时候才能停止这集?当谈话结束的时候?还是一个固定的数字?我认为这些仍然是很难解决的问题,因为在这样的用例中,收敛是一个挑战。

如果有人破解了它,他们很可能不会发表任何东西,因为一个真正的研究人员只会发表那些可以复制的东西,或者他们只是在保密:)

票数 0
EN

Data Science用户

发布于 2022-01-02 16:30:48

一个例子是Debmalya Biswas的“基于强化学习的自我改进聊天机器人”。有一个代码

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/63880

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档