据我所知,Stanford NER有3、4和7个class模型(或标签)。我需要一个标准和命名实体识别器的Java实现,它有超过7个标签(例如13个标签)。我不想自己开发它,我需要它是准确的。有没有满足这些条件的NER?
谢谢
发布于 2016-06-15 08:02:30
斯坦福NER系统可以针对任意数量的标签进行再训练。3、4和7类模型只是预先训练好的模型。如果你想在更多的班级上训练它,你必须收集包含这些班级的训练数据,并重新训练模型。
发布于 2016-06-16 00:07:46
Python nltk包提供了命名实体识别(NER),它有一个内置的分类器。它有7个以上的类。它们是
ORGANIZATION - Georgia-Pacific Corp., WHO
PERSON - Eddy Bonte, President Obama
LOCATION - Murray River, Mount Everest
DATE - June, 2008-06-29
TIME - two fifty a m, 1:30 p.m.
MONEY - 175 million Canadian Dollars, GBP 10.40
PERCENT - twenty pct, 18.75 %
FACILITY - Washington Monument, Stonehenge
GPE - South East Asia, Midlothian 您使用的是Java,因此在java中有一个等效的包,它就是OpenNLP。您可以在OpenNLP中检查分类器。
下面是证明OpenNLP等同于nltk的SO link
https://stackoverflow.com/questions/37803590
复制相似问题