首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从给定文本中提取多个值的自学习解决方案

从给定文本中提取多个值的自学习解决方案
EN

Stack Overflow用户
提问于 2017-07-12 21:20:18
回答 1查看 50关注 0票数 0

比方说,Message1 =您的金额为121.0的汇票应于2月15日到期,类似地,Message2 =票据amt 234.0应于6月11日到期等。我想从类似的消息中提取账单金额和到期日。一种方法是为每种可能的格式编写正则表达式。但这将无法处理新的格式。

解决这个问题的机器学习方法是什么?我如何训练一个模型,并使用它从更新的消息中提取数量、到期日?

EN

回答 1

Stack Overflow用户

发布于 2017-07-13 04:52:52

为了更好地回答你的问题,我需要知道如何提供培训数据?你会得到每个训练例子的标签吗?你想要使用任何涉及深度神经网络的先进技术吗?

例如,如果您想使用序列标记,那么您可以参考基于Alex Graves的递归神经网络有监督序列标记第2章获得更多细节。对于你的任务,我认为你可以先尝试更简单的方法。

例如,模式挖掘或基于模板的方法在这方面应该对您有所帮助。此外,分析技术,例如,依赖分析可以帮助您在这种情况下。见依赖分析与成分分析的区别

最后,您还可以考虑在此场景中著名的信息提取技术。有关此问题,请参见NLTK的使用

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45067698

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档