首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何训练斯坦福纳的名字,包括空格?

如何训练斯坦福纳的名字,包括空格?
EN

Stack Overflow用户
提问于 2016-10-25 21:12:18
回答 1查看 517关注 0票数 0

在用简单的示例训练摘录标记后,split(' ')标记单项名称。

我需要训练和识别包含空格的名字。我该如何训练识别器?

例如:“我看到了一棵大红苹果树。”--我如何标记训练,然后识别“大红苹果树”,而不是识别四个单独的单词?

这对培训数据有用吗?

代码语言:javascript
复制
I\tO
saw\tO
a\tO
Big Red Apple Tree\tMyName
.\tO

来自识别器的输出是否与此相同?

FAQ中的培训部分说:“训练文件解析器并不是很宽容:您应该确保每一行只包含内容字段和制表符,空格不起作用。”

EN

回答 1

Stack Overflow用户

发布于 2017-09-25 09:31:01

你想要解决的问题属于短语识别。你可以用不同的方式给单词贴上标签。例如,您可以用IOB标记标记单词。将斯坦福纳模型训练到这些新创建的数据上。编写后处理步骤以连接预测的数据。

例如:

您的培训数据应该如下所示:

代码语言:javascript
复制
I\tO
saw\tO
a\tO
Big\tB-MyName
Red\tI-MyName
Apple\tI-MyName
Tree\tO-MyName
.\tO<br/>

因此,基本上,您使用[ 0, B-MyName , I-MyName , O-MyName ]作为标记。我已经解决了类似的问题,而且效果很好。但要确保你有足够的数据来训练它。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40249793

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档