首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Stanford-Parser从文本中提取阿拉伯专有名称

使用Stanford-Parser从文本中提取阿拉伯专有名称
EN

Stack Overflow用户
提问于 2011-06-28 19:17:37
回答 1查看 607关注 0票数 1

我正在尝试使用斯坦福解析器从文本中提取阿拉伯专有名称。

例如,如果我有一个输入句子:

代码语言:javascript
复制
تكريم سعد الدين الشاذلى

使用阿拉伯语Stanford解析器,树形图将是:

代码语言:javascript
复制
(ROOT (NP (NN تكريم) (NP (NNP سعد) (DTNNP الدين) (NNP الشاذلى))))

我想提取正确的名称:

代码语言:javascript
复制
سعد الدين الشاذلى

其中包含子树:

代码语言:javascript
复制
(NP (NNP سعد) (DTNNP الدين) (NNP الشاذلى))

我已经尝试过了:similar question

但这一行中有一些地方是错误的:

代码语言:javascript
复制
List<TaggedWord> taggedWords = (Tree) lp.apply(str);

将树类型放在标记词列表中的错误是我不理解的另一件事,即在哪里可以使用建议的taggedYield()函数

有什么想法吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-08-10 05:13:40

就库而言,这是非常基本的Java,但您需要的是:

代码语言:javascript
复制
Tree tree = lp.apply(str);
List<TaggedWord> taggedWords = tree.taggedYield();
for (TaggedWord tw : taggedWords) {
  if (tw.tag().contains("NNP")) {
    System.err.println(tw.word());
  }
}    
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6505569

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档