我一直在使用新的EntityRuler ( https://spacy.io/usage/rule-based-matching#entityruler )向我的自定义Spacy命名实体识别模型添加规则。
我添加了100万个蛋白质的名称,运行了几个小时,现在意识到它们中的许多名称都是常见的单词(如“FOR”和“11”)。
我想从EntityRuler对象( https://spacy.io/api/entityruler )中删除一些模式。但我不确定该怎么做。
如何从EntityRuler对象中删除规则/模式?而不卸载所有内容并加载应该保留的内容。
发布于 2020-03-15 18:32:53
查看源代码(https://github.com/explosion/spaCy/blob/master/spacy/pipeline/entityruler.py),EntityRuler对象将模式直接传递给Matcher对象。您可以轻松地访问EntityRuler的Matcher对象,如下所示(假设您的EntityRuler对象名为entity_ruler):
matcher = entity_ruler.matcherMatcher对象有一个移除模式/规则的方法,如接口(https://spacy.io/api/matcher)中所述。因此,您可以通过键入以下命令来删除模式
matcher.remove(<insert pattern ID here>)https://stackoverflow.com/questions/60638734
复制相似问题