文章/答案/技术大牛

发布

社区首页 >问答首页 >使用Stanford-Parser从文本中提取阿拉伯专有名称

问使用Stanford-Parser从文本中提取阿拉伯专有名称
EN

Stack Overflow用户

提问于 2011-06-28 19:17:37

回答 1查看 607关注 0票数 1

我正在尝试使用斯坦福解析器从文本中提取阿拉伯专有名称。

例如，如果我有一个输入句子：

تكريم سعد الدين الشاذلى

使用阿拉伯语Stanford解析器，树形图将是：

(ROOT (NP (NN تكريم) (NP (NNP سعد) (DTNNP الدين) (NNP الشاذلى))))

我想提取正确的名称：

سعد الدين الشاذلى

其中包含子树：

(NP (NNP سعد) (DTNNP الدين) (NNP الشاذلى))

我已经尝试过了：similar question

但这一行中有一些地方是错误的：

List<TaggedWord> taggedWords = (Tree) lp.apply(str);

将树类型放在标记词列表中的错误是我不理解的另一件事，即在哪里可以使用建议的taggedYield()函数

有什么想法吗？

stanford-nlp

text-parsing

arabic

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-08-10 05:13:40

就库而言，这是非常基本的Java，但您需要的是：

Tree tree = lp.apply(str);
List<TaggedWord> taggedWords = tree.taggedYield();
for (TaggedWord tw : taggedWords) {
  if (tw.tag().contains("NNP")) {
    System.err.println(tw.word());
  }
}

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/6505569

复制

相似问题

问使用Stanford-Parser从文本中提取阿拉伯专有名称
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Stanford-Parser从文本中提取阿拉伯专有名称EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Stanford-Parser从文本中提取阿拉伯专有名称
EN