首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于LingPipe的门中命名实体识别

基于LingPipe的门中命名实体识别
EN

Stack Overflow用户
提问于 2016-02-28 15:37:10
回答 1查看 276关注 0票数 3

他说:我正在使用GATE NLP处理我的文档,我想使用实体名作为门上的候选标记--这里有OpenNLPLingPipe,我正在阅读here @Shashikant答卷。

如果你有一句话“我的朋友乔·史密斯去了沃尔玛商店”,OpenNLP就能识别出两个有名字的实体--“乔·史密斯”和“沃尔玛”。我不能把“乔·史密斯”写成“人”,“沃尔玛”写成“组织”。

并建议使用LingPipe,所以我使用了Gate中提供的LingPipe,如下所示

代码语言:javascript
复制
SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
        Corpus corpus = Factory.newCorpus("SegmenterCorpus");
        Document document = Factory.newDocument(handler.toString());
        corpus.add(document); 
        pipeline.setCorpus(corpus); 
        pipeline.execute();

然而,当我运行我的程序时,我有这个异常。

线程"main“gate.creole.ResourceInstantiationException中的异常:没有提供模型文件!在gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55) at gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)

没有提供模型文件意味着什么??对不起,因为我问这个问题,但我对这个领域完全陌生,我只是了解安妮,它不需要任何文件,当我使用它来提取POS标记任何帮助?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-07 14:34:44

终于对我起作用了。

我在GATE中尝试了File -> Ready Made Applications -> LingPipe -> LingPipe IE System。已经装好了。

工作模式是:$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker

gate.lingpipe.NamedEntityRecognizerPR的完整相关配置是:

代码语言:javascript
复制
...    
<string>modelFileUrl</string>
<gate.util.persistence.PersistenceManager-URLHolder>
  <urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString>
</gate.util.persistence.PersistenceManager-URLHolder>
...

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35684497

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档