文章/答案/技术大牛

发布

社区首页 >问答首页 >Spacy在训练自定义模型时使用哪种深度学习算法？

问Spacy在训练自定义模型时使用哪种深度学习算法？
EN

Stack Overflow用户

提问于 2020-02-24 17:33:52

回答 1查看 7.2K关注 0票数 7

当我们训练自定义模型时，我确实看到我们需要调整掉的参数和n_iter参数，但是Spacy使用什么深度学习算法来训练自定义模型呢？另外，当添加新的实体类型时，创建空白或在现有模型上进行培训是好的吗？

nlp

spacy

named-entity-recognition

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-02-25 12:04:59

spaCy使用哪种学习算法？

spaCy有自己的深度学习库，名为thinc，用于不同的NLP模型。对于大多数(如果不是全部)任务，spaCy使用了一个基于CNN的深度神经网络，并做了一些调整。专门用于命名实体识别，spacy使用：

一种基于转换的方法借用了shift-约简解析器，由Lample等人在论文命名实体识别的神经结构中描述。Matthew描述了spaCy是如何在YouTube视频上使用这个的。
一个叫做的框架，叫做“Embed. Encode. video.”(在视频上启动这里 )，幻灯片这里。

- **Embed**: Words are embedded using a Bloom filter, which means that word hashes are kept as keys in the embedding dictionary, instead of the word itself. This maintains a more compact embeddings dictionary, with words potentially colliding and ending up with the same vector representations.

- **Encode**: List of words is encoded into a sentence matrix, to take context into account. spaCy uses CNN for encoding.

- **Attend**: Decide which parts are more informative given a query, and get problem specific representations.

- **Predict**: spaCy uses a multi layer perceptron for inference.

这一框架的优点是：

主要等同于序列标记(另一个任务spaCy提供模型)
与解析器共享代码。
容易排除无效序列
任意特征很容易定义。

作为一个完整的概述，Matthew描述了该模型如何在这个YouTube视频中工作。幻灯片可以找到这里。

注:本信息基于2017年的幻灯片。从那以后引擎可能就变了。

当添加一个新的实体类型时，我们应该创建一个空白模型还是训练一个现有的模型？

理论上，当用新实体对spaCy模型进行微调时，您必须确保模型不会忘记以前学过的实体的表示。最好的办法，如果可能的话，就是从头开始训练一个模型，但由于缺乏数据或资源，这可能并不容易，也不可能。

编辑2021年2月：spaCy版本3现在使用变压器体系结构作为其深度学习模型。

票数 19

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60381170

复制

相似问题

问Spacy在训练自定义模型时使用哪种深度学习算法？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Spacy在训练自定义模型时使用哪种深度学习算法？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Spacy在训练自定义模型时使用哪种深度学习算法？
EN