我正在用rasa-nlu构建一个聊天机器人。我看过了教程,我已经构建了一个简单的机器人。然而,我需要大量的训练数据来构建一个聊天机器人,能够预订出租车。所以我需要数据来构建一个特定的机器人。
是否有用于预订出租车的存储库或语料库?或者有没有一种方法可以生成这种数据集?
发布于 2017-08-23 00:01:58
这是一篇来自Rasa创始人之一的博客文章,我认为它提供了一些非常好的建议。我认为你要求预先建立训练集的方式是错误的。自己开始,然后添加朋友,等等,直到你建立了一个最适合你的机器人的训练集。
除此之外,Rasa文档在improving model performance下提供了以下内容
当rasa_nlu服务器运行时,它会跟踪所做的所有预测,并将这些预测保存到日志文件中。默认情况下,日志文件放在logs/中。此目录中的文件每行包含一个json对象。您可以修复任何错误的预测,并将它们添加到您的训练集中,以改进您的解析器。
我想你会惊讶于你能用你自己想出的训练集走多远。
祝你好运找到语料库,但无论哪种方式,希望这些链接和片段有所帮助。
发布于 2017-11-04 23:24:41
执行此操作的一种方法是,前往
使用Office 365登录,制作自己的出租车预订应用程序,输入意图和话语,如下所示:


现在,在训练和发布模型之后,下载语料库,如下所示:

现在,下载语料库后,它将如下所示:

安装RASA NLU,我的机器上安装了Windows 8.1,因此步骤如下:
以下是配置RASA的步骤:
第一次安装: Anaconda 4.3.0用于安装Python3.6的64位Windows解释器:https://repo.continuum.io/archive/Anaconda3-4.3.0-Windows-x86_64.exe
&
Python Tools for Visual Studio2015:https://ptvs.azureedge.net/download/PTVS%202.2.6%20VS%202015.msi
接下来,在命令提示符的管理模式下,按此顺序安装以下软件包:
code>pip install -U NLU:pip install -U NLU
成功安装上述所有包后,制作一个spaCy配置文件,RASA将读取该文件,如下所示:
{
"project": "Travel",
"pipeline": "spacy_sklearn",
"language": "en",
"num_threads": 1,
"max_training_processes": 1,
"path": "C:\\Users\\Kunal\\Desktop\\RASA\\models",
"response_log": "C:\\Users\\Kunal\\Desktop\\RASA\\log",
"config": "C:\\Users\\Kunal\\Desktop\\RASA\\config_spacy.json",
"log_level": "INFO",
"port": 5000,
"data": "C:\\Users\\Kunal\\Desktop\\RASA\\data\\FlightBotFinal.json",
"emulate": "luis",
"spacy_model_name": "en",
"token": null,
"cors_origins": ["*"],
"aws_endpoint_url": null
}接下来,创建一个目录结构,如下所示:
data folder ->将包含所有LUIS格式的语料库
models ->将包含所有经过训练的模型
logs ->将包含活动学习日志和RASA框架日志
像这样,

现在,制作用于训练和启动RASA NLU服务器的批处理文件脚本。
使用记事本或Visual Studio代码创建一个TrainRASA.bat,并编写以下代码:
python -m rasa_nlu.train -c config_spacy.json
pause现在使用记事本或Visual Studio Code创建一个StartRASA.bat,并编写以下代码:
python -m rasa_nlu.server -c config_spacy.json
pause现在,通过单击您刚才创建的批处理文件脚本来训练并启动RASA Server。
现在,一切都准备好了,只需启动chrome并向enpoint /parse发出HTTP GET请求。
喜欢:http://localhost:5000/parse?q=&project=
您将获得一个对应于Bot Framework C#的LUISResult类的JSON响应。

现在处理您想要在此之后执行的业务逻辑。
或者,您可以查看RASA核心,它主要是为此目的而构建的。
RASA Core, which uses machine learning to build dialogs instead of simple if-else statements.
发布于 2018-05-28 02:48:21
下面的链接包含与商业聊天机器人应用程序相关的数据集(“人机对话”)。它是一个相当全面的人-人和人机文本对话数据集的集合,以及音频对话数据集。https://breakend.github.io/DialogDatasets/
https://stackoverflow.com/questions/45821517
复制相似问题