我有一个可操作的QnA Maker,几乎所有的条款都没有问题。但是,我注意到,即使知识库中存在某些术语,这些术语也不会生成聊天机器人响应。
具体地说,下面的术语可以添加到知识库的Q和A字段中(我已经确认这些术语实际上在知识库中)。但是,聊天机器人将返回消息"No good match found in KB“。当查询术语时。这些条款包括:
·那是我,那是我
·?
·独立表情符号(例如❤️)
抛开表情符号不谈,我可以看出这些术语是如何被保留的。有没有办法在QnA Maker知识库中避开它们?还有其他建议吗?
发布于 2021-11-15 09:11:59
是时候再拍拍手掌了..。
“那个我,那是我”,这些都是STOPWORDS。
来自https://github.com/Azure-Samples/azure-search-sample-data/blob/master/STOPWORDS.md,
当文本被索引到Azure Cognitive Search中时,分析器会对其进行处理,因此可以将其高效地存储在搜索索引中。在这个词法分析过程中,语言分析器将删除特定于该语言的停用词。Lucene和微软的分析器都是如此。
如果我理解正确,那么通过创建一个Q&A对,其中一部分只包含停用词,然后将其剥离,我就创建了一个空Q&A对。
作为参考,上面的github链接提供了STOPWORDS的完整列表。
https://stackoverflow.com/questions/69648903
复制相似问题