要么我错过了他们的文档,要么他们真的很难找到它。任何指向我在哪里可以找到关于底层模型的信息的指针都会很有帮助
对于更多的上下文,我将它用于一个带有自定义标签的NER任务,但我认为这并不是很重要。
发布于 2020-11-10 22:14:03
空白模型没有预先训练好的标记器、解析器和NER。
spacy.blank函数在这里:Github link。它只调用util.get_lang_class(name),从这里加载一个特定于语言的模块:Github link to spacy/lang
下面是空白英语模型代码的链接:Github link to spacy English model
详细的文档在这里:Adding new languages
如果您唯一要更改的是NER,我将从预先训练的模型(我假设是英语)开始,然后禁用NER管道:
nlp = spacy.load("en_core_web_sm", disable = ['ner'])使用这个模型实例nlp,你可以训练你的NER (如果它是基于ML的)或者添加EntityRuler管道(如果你的NER是基于规则的)。这样,您仍然可以使用POS标记器和依赖关系解析器。完成训练后,只需使用to_disk保存模型。如果您使用EntityRuler (基于规则的NER),您将需要编写几行代码来注册新管道(在他们的web-ste上有很好的文档)
https://stackoverflow.com/questions/64724483
复制相似问题