我们可以在基于spacy或bert的自定义NER模型中拥有的实体的最大极限是什么?我见过网络上的例子,它们被训练成每个模型最多有10个自定义实体,甚至Ontonotes数据集也有18个实体,那么在一个NER模型中拥有一定数量的实体会影响模型的学习能力和性能吗?
发布于 2022-05-08 15:13:34
我不认为有一定的限制,但增加班级数量肯定会对学习产生负面影响。您可以用50个类来训练一个模型,但是学习性能取决于您的数据集如何表示每个类(是否存在类不平衡问题等等)。以及您的类之间是否容易区分。
https://stackoverflow.com/questions/72162213
复制相似问题