我有一个关于api.ai和wit.ai等聊天机器人平台如何工作的问题。您只需为每个意图/类提供几个模板,然后他们的系统就能够将新用户查询分类到这些类中的一个。我正在尝试做同样的事情,并测试了SVM、逻辑回归、朴素贝叶斯和其他一些算法。对于特征提取部分,我尝试了人们通常使用的大多数特征,如n-gram,向量表示,弓等。在这种情况下,当每个类只有几个模板时,最好的算法是什么?
感谢Amir :)
发布于 2016-12-23 08:29:28
你不可能真的根据几个例子做任何好的分类。已建立的平台可以这样做的方式是通过寻找类似的意图、示例等,这些已经由系统的其他客户端或创建者提供,然后尝试推断。
所以重点是他们已经有了一些先验数据,并且他们基于这些先验数据来进行分类结果。
您可以做的是--挖掘您可以找到的任何开放源码,以获取与您的示例类似的示例。然后你可以尝试用它来训练你的分类器。然而,在任何情况下,首先有一些合理的训练数据集是值得的。
https://stackoverflow.com/questions/41211413
复制相似问题