首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Java命名实体识别库

Java命名实体识别库
EN

Stack Overflow用户
提问于 2008-10-09 16:54:54
回答 4查看 22.8K关注 0票数 27

我正在寻找一个简单但“足够好”的java命名实体识别库(和字典),我希望处理电子邮件和文档,并提取一些“基本信息”,如:姓名,地点,地址和日期。

我一直在四处寻找,大多数似乎都是重的和完整的NLP类的项目。

有什么建议吗?

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2008-12-23 21:15:22

顺便说一句,我最近遇到了OpenCalais,它似乎有我想要的功能。

票数 1
EN

Stack Overflow用户

发布于 2008-10-09 19:28:34

你可能想看看类似问题的my earlier answers中的一个。

除此之外,大多数轻量级系统在很大程度上依赖于所使用的域。例如,你会找到一大堆关于生物医学NER系统的工具和论文。除了我之前的帖子(如果你想做NER,它已经包含了我的主要建议),这里还有一些你可能想要研究的工具:

如果您对这个特定的Stanford CER-NER

  • The感兴趣,那么
    • Postech Biomedical NER System似乎是一个商业系统。虽然有UIMA wrappers for OpenCalais,但它们似乎已经过时了。还有一个针对UIMA的基于字典的上下文映射器注释器,它可能会对您有所帮助。值得注意的是,UIMA意味着在学习曲线上有很大的开销,在其他things.
    • ABNER中也有NER,但它仍然专注于生物医学领域。德国耶拿大学的
    • ;-)
    • OpenNLP JULIE Lab Tools也有NER。它们有独立版本和UIMA分析引擎。

另请注意:如果不对输入进行标记化,您将无法脱颖而出。自然语言的标记化是微不足道的,这就是为什么我建议你使用一个工具箱,为你做这两件事。

票数 23
EN

Stack Overflow用户

发布于 2011-04-28 04:42:33

您可能也想尝试一下Alchemy API。它类似于Open Calais。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/188176

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档