我有很多现有的数据,我想用这些数据作为wit.ai聊天机器人的培训数据。数据存储在csv文件中,其中每行都有一个语句/问题和对该语句/问题的响应。
我知道wit.ai要求您为所做的评论指定意图,所以我想知道是否有一种方法可以简单地发送我所拥有的数据,并让聊天机器人自己开始学习意图。
谢谢!
发布于 2016-06-14 08:05:25
“教学”Wit.Ai并不是某些人可能认为的那样。
您必须为您的User says专栏创建故事。老实说,这些答复是无关紧要的。你不能“教”wit.ai回复。答复在故事中或代码中定义。
wit.ai可能需要从您的数据是关键字和关键短语,使实体识别更好的wit.ai。
以下是最简单的例子:

实体color是基于关键字列表进行识别的。因此,如果您有大量的数据作为用户输入的例子--您可以尝试先将其分解为“用户输入应该生成哪些实体”,然后从这些输入中进行关键字。
使用您的数据进行“教学”--这有点困难,因为它将要求您在wit.ai中创建大量的故事,以涵盖可能的用户输入和实体标识。但你还是可以这样做:
(粗略的例子)

这个过程将“教导”实体,如果它们是基于关键字或其他一些算法。
这是我所能想到的关于如何使用现有数据的最好方法。Wit.Ai不同于其他语言处理工具集,使用现有数据进行“教学”有点“令人费解”:)
发布于 2016-06-30 18:33:32
谢谢你发帖。我们知道这还不完美,但是几天前我们发布了一个导入/导出特性。从json导出的结构来看,很可能很容易将现有数据提供给用户。这将需要在每个陈述/问题和答复中创建一个故事。更多信息在这里:https://wit.ai/docs/recipes#copyexportversion-my-app
https://stackoverflow.com/questions/37799304
复制相似问题