首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使spaCy不区分大小写

如何使spaCy不区分大小写
EN

Stack Overflow用户
提问于 2018-06-16 20:17:31
回答 2查看 7K关注 0票数 5

如何在查找实体名称时使spaCy不区分大小写?

有没有我应该添加的代码片段,或者什么,因为问题可能会提到不是大写的实体?

代码语言:javascript
复制
def analyseQuestion(question):

    doc = nlp(question)
    entity=doc.ents 

    return entity

print(analyseQuestion("what is the best seller of Nicholas Sparks "))  
print(analyseQuestion("what is the best seller of nicholas sparks "))    

这给了我们

代码语言:javascript
复制
(Nicholas Sparks,)  
()
EN

回答 2

Stack Overflow用户

发布于 2020-08-11 10:51:41

这是旧的,但希望这能帮助任何人看到类似的问题。

你可以用真实感来改善你的结果。

https://pypi.org/project/truecase/

票数 0
EN

Stack Overflow用户

发布于 2018-07-28 17:34:11

这很简单。您只需要在您的函数中添加question.lower()的预处理步骤:

代码语言:javascript
复制
def analyseQuestion(question):

    # Preprocess question to make further analysis case-insensetive
    question = question.lower()

    doc = nlp(question)
    entity=doc.ents 

    return entity

该解决方案的灵感来自于Rasa NLU库中的this code。但是,对于非英语(非ASCII)文本,它可能无法工作。在这种情况下,您可以尝试:

代码语言:javascript
复制
question = question.decode('utf8').lower().encode('utf8')

然而,spacy中的NER模块在某种程度上取决于标记的大小写,您可能会遇到一些差异,因为它是一个经过统计训练的model.Refer this link

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50887830

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档