我正在尝试建立一个问题回答系统,其中我有一组预定义的问题和他们的答案。对于来自用户的任何给定问题,我必须查找类似的问题是否已经存在于预定义的问题中,并发送答案。如果它不存在,它必须回复一个通用响应。任何关于如何使用NLP实现这一点的想法都会非常有帮助。
提前感谢!!
发布于 2020-03-16 03:05:10
正如您在问题中已经提到的,这需要一个计算文本相似度的解决方案。在这种情况下,问题-问题相似度。您已经有了一堆问题,对于传入的查询/问题,必须计算每个可用问题的相似度得分。从a previous answer of mine开始,做简单的句子相似度,
要实现1,您可以考虑将句子中的每个单词转换为相应的向量。有像fasttext这样的库/算法提供矢量映射。整个句子的向量表示是通过取所有单词向量的平均值来获得的。使用余弦相似度计算查询和可用列表中的每个问题之间的分数。
https://stackoverflow.com/questions/60693346
复制相似问题