首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >跟踪地址需要Apache UIMA注释

跟踪地址需要Apache UIMA注释
EN

Stack Overflow用户
提问于 2014-06-10 17:21:29
回答 2查看 168关注 0票数 1

我们有一个需求,需要使用Apache UIMA跟踪非结构化文档中的“地址”数据。地址可以来自任何地理位置。英国地理位置的一些示例地址如下所示。PE10 1LW林肯郡伯恩桑基街6 6CM 227号士丹利路190号

如果您能分享用于从非结构化文档中标识地址数据的可能注释,将会很有帮助。

EN

回答 2

Stack Overflow用户

发布于 2014-06-10 22:11:27

我建议您使用RUTA workbench编写规则来提取地址。它将真的加速,并简化您的工作与UIMA。

票数 1
EN

Stack Overflow用户

发布于 2014-06-11 16:57:36

有两种方法(示例参考特定于UIMA的工具):

  • 手动指定提取规则,例如,使用UIMA RutazanzibarUIMA Regex,...
  • 注释足够的示例并训练模型,例如,使用ClearTKOpenNLP,...<代码>H29<代码>F210

哪种方法最适合您取决于您的需求。许多人认为统计模型总体上优于基于规则的方法。然而,有时编写一些规则要比注释足够多的示例更快。

(我是UIMA Ruta的开发者)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24137312

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档