首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用于构建聊天机器人的对话数据

用于构建聊天机器人的对话数据
EN

Stack Overflow用户
提问于 2017-08-22 23:19:27
回答 4查看 3.7K关注 0票数 0

我正在用rasa-nlu构建一个聊天机器人。我看过了教程,我已经构建了一个简单的机器人。然而,我需要大量的训练数据来构建一个聊天机器人,能够预订出租车。所以我需要数据来构建一个特定的机器人。

是否有用于预订出租车的存储库或语料库?或者有没有一种方法可以生成这种数据集?

EN

回答 4

Stack Overflow用户

发布于 2017-08-23 00:01:58

这是一篇来自Rasa创始人之一的博客文章,我认为它提供了一些非常好的建议。我认为你要求预先建立训练集的方式是错误的。自己开始,然后添加朋友,等等,直到你建立了一个最适合你的机器人的训练集。

Put on your robot costume

除此之外,Rasa文档在improving model performance下提供了以下内容

当rasa_nlu服务器运行时,它会跟踪所做的所有预测,并将这些预测保存到日志文件中。默认情况下,日志文件放在logs/中。此目录中的文件每行包含一个json对象。您可以修复任何错误的预测,并将它们添加到您的训练集中,以改进您的解析器。

我想你会惊讶于你能用你自己想出的训练集走多远。

祝你好运找到语料库,但无论哪种方式,希望这些链接和片段有所帮助。

票数 4
EN

Stack Overflow用户

发布于 2017-11-04 23:24:41

执行此操作的一种方法是,前往

使用Office 365登录,制作自己的出租车预订应用程序,输入意图和话语,如下所示:

现在,在训练和发布模型之后,下载语料库,如下所示:

现在,下载语料库后,它将如下所示:

安装RASA NLU,我的机器上安装了Windows 8.1,因此步骤如下:

以下是配置RASA的步骤:

第一次安装: Anaconda 4.3.0用于安装Python3.6的64位Windows解释器:https://repo.continuum.io/archive/Anaconda3-4.3.0-Windows-x86_64.exe

&

Python Tools for Visual Studio2015:https://ptvs.azureedge.net/download/PTVS%202.2.6%20VS%202015.msi

接下来,在命令提示符的管理模式下,按此顺序安装以下软件包:

  1. Spacy机器学习软件包:pip安装-U spacy
  2. Spacy英语模型:-m scipy
  3. Sklearn spacy下载sklearn-crfsuite
  4. NER软件包:pip安装用于数学计算的python软件包:-U pip安装用于数学计算的软件包:-U pip安装用于意图识别的python软件包:pip安装-U使用Spacy更好地识别实体:duckling
  5. RASA rasa_nlu==0.10.4

code>pip install -U NLU:pip install -U NLU

成功安装上述所有包后,制作一个spaCy配置文件,RASA将读取该文件,如下所示:

代码语言:javascript
复制
{
    "project": "Travel",
    "pipeline": "spacy_sklearn",
    "language": "en",
    "num_threads": 1,
    "max_training_processes": 1,
    "path": "C:\\Users\\Kunal\\Desktop\\RASA\\models",
    "response_log": "C:\\Users\\Kunal\\Desktop\\RASA\\log",
    "config": "C:\\Users\\Kunal\\Desktop\\RASA\\config_spacy.json",
    "log_level": "INFO",
    "port": 5000,
    "data": "C:\\Users\\Kunal\\Desktop\\RASA\\data\\FlightBotFinal.json",
    "emulate": "luis",
    "spacy_model_name": "en",
    "token": null,
    "cors_origins": ["*"],
    "aws_endpoint_url": null
  }

接下来,创建一个目录结构,如下所示:

data folder ->将包含所有LUIS格式的语料库

models ->将包含所有经过训练的模型

logs ->将包含活动学习日志和RASA框架日志

像这样,

现在,制作用于训练和启动RASA NLU服务器的批处理文件脚本。

使用记事本或Visual Studio代码创建一个TrainRASA.bat,并编写以下代码:

代码语言:javascript
复制
 python -m rasa_nlu.train -c config_spacy.json
 pause

现在使用记事本或Visual Studio Code创建一个StartRASA.bat,并编写以下代码:

代码语言:javascript
复制
python -m rasa_nlu.server -c config_spacy.json
pause

现在,通过单击您刚才创建的批处理文件脚本来训练并启动RASA Server。

现在,一切都准备好了,只需启动chrome并向enpoint /parse发出HTTP GET请求。

喜欢:http://localhost:5000/parse?q=&project=

您将获得一个对应于Bot Framework C#的LUISResult类的JSON响应。

现在处理您想要在此之后执行的业务逻辑。

或者,您可以查看RASA核心,它主要是为此目的而构建的。

RASA Core, which uses machine learning to build dialogs instead of simple if-else statements.

票数 2
EN

Stack Overflow用户

发布于 2018-05-28 02:48:21

下面的链接包含与商业聊天机器人应用程序相关的数据集(“人机对话”)。它是一个相当全面的人-人和人机文本对话数据集的集合,以及音频对话数据集。https://breakend.github.io/DialogDatasets/

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45821517

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档