我有2万条信息(电子邮件和实时聊天的结合)在我的客户和我的支持人员之间。我也有我的产品的知识库。
通常情况下,客户提出的问题非常简单,我的支持人员只是简单地向他们指出正确的知识库文章。
为了节省我的支持人员的时间,我想要做的是向我的工作人员展示一份根据初始用户的支持请求可能相关的文章列表。这样,他们就可以复制并粘贴到帮助文章的链接,而不是加载知识库和手动搜索文章。
我在想我该研究什么解决方案。
我目前的思路是对现有数据进行分析,并使用文本分类方法:
不知道我是不是把事情复杂化了。如能就如何做到这一点提出任何建议,将不胜感激。
朴素的方法只是把‘关键短语’扔到我们知识库的搜索查询中,结果不太好,因为帮助文章的内容通常不同于一个人在电子邮件或实时聊天中表达问题的方式。
发布于 2017-02-06 02:13:07
一个类似于“垃圾邮件”分类器的简单分类器可能有效,只不过每个常见问题都是一个特性,而不是垃圾邮件的单个特征分类器。
大多数垃圾邮件分类器都是从单词/短语词典开始。你已经开始用你天真的方法了。但是,与您的方法不同,垃圾邮件分类器所做的远远超过文本搜索。本质上,在垃圾邮件分类器中,给出了客户电子邮件中的每个单词的权重,权重之和表示消息是否是垃圾邮件。现在,将其扩展到与常见问题相同的特性。也就是说,类似于: FAQ1或not-FAQ2 1、FAQ2或not-FAQ2 2等特性。
因为您的支持人员可以很容易地识别出电子邮件需要哪些常见问题,那么使用监督学习算法是合适的。为了减少任何错误分类错误的影响,然后考虑应用程序向支持人员展示客户的电子邮件,然后是计算机生成的响应,所有支持人员都必须-批准或修改响应。修改响应应该会在培训集中产生一个新条目。
支持向量机是实现机器学习的一种方法。但是,在使用更复杂的方法之前,您可能会过早地提出这个解决方案,首先确定问题,然后尽可能地得到一个简单的方法。毕竟,如果一个多功能垃圾邮件分类器起作用,为什么要在其他同样有效的东西上投入更多的时间和金钱?
最后,取决于您的系统,这是我想要做的事情。
https://stackoverflow.com/questions/42036711
复制相似问题