首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于Google的嵌套命名实体识别

基于Google的嵌套命名实体识别
EN

Stack Overflow用户
提问于 2020-03-11 14:36:45
回答 1查看 253关注 0票数 1

我们可以通过上传pdf完整的文档,标记简单实体和训练来实现简单的命名实体识别。

但是,谷歌云AutoML平台是否支持嵌套命名实体识别(n)?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-03-17 17:21:16

不是默认的。据我所知,也没有实现嵌套命名实体识别的标准化方法,这可能是不支持嵌套命名实体识别的原因之一。我设想在一个过程中这样做,每个注释都需要在其中包含多个注释,这是不可能的:

每个注释最多可以覆盖10个标记(单词)。它们不能重叠;注释的start_offset不能在同一文档中注释的start_offset和end_offset之间。[文档]

但是,您可以根据对嵌套NER的理解亲自实现这一点。训练一个通用模型来提取主要实体(较大的包含实体)。然后,训练一个辅助模型来提取次要实体(主实体中的实体)。只对主模型的输出运行辅助模型。您可能还应该实现一些条件,比如令牌的数量。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60638539

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档