我正在寻找一个库,它可以进行文本分析和实体提取。
实体的类型/分类并不重要,关键在于识别有价值的东西。在这种情况下,实体宇宙是无限的,它不受固定字典的限制。
似乎有几个web服务能够做到这一点(书呆子让您比较这些web服务的结果:非常有用的http://nerd.eurecom.fr/documentation ),但是我正在寻找一个本地库,而不是远程托管的服务。我更喜欢Java或.NET,但是如果它是一个好的库,我将学习它所用的任何语言。
关于类似主题的旧线程很少,我希望在这个领域找到新的开发,和/或建立在较低级别NLP库之上的库:
有谁知道一个做得不错的好图书馆吗?
发布于 2012-12-02 05:04:49
我研究过但从未使用过以下托管实体标识服务:
OpenCalais
AlchemyAPI
发布于 2012-12-02 23:11:06
如果您对Perl很满意,那么有几种语言taggers /部件可以使用(语言:TreeTagger和语言:BrillTagger (通过Google))。
发布于 2013-03-19 18:59:36
您可以使用NLTK和Python。有关使用NLTK执行NER的示例,请参阅这个问题。
https://stackoverflow.com/questions/13666142
复制相似问题