我是UIMA的新手。
我想用UIMA和uimaFIT开发一个应用程序,它可以解析任何与机票相关的电子邮件,如确认邮件、取消邮件等,并从中提取有价值的信息,如机票号、航班号、起飞时间、到达时间、乘客姓名等。如何使用uimaFIT实现这一点?目前,我尝试使用uimaFIT来读取字符串,并使用正则表达式试图提取信息,但由于电子邮件不是结构化的,这似乎太复杂了。任何关于如何在不使用RegEx的情况下连接电子邮件和执行解析的建议。
任何建议。
发布于 2013-04-25 13:51:59
您的邮件类型(确认邮件、取消邮件等)是否足够小?如果是,在第一步,尝试做一个简单的分类类型的电子邮件。然后在接下来的步骤中,您可以根据电子邮件的类型应用不同的工具。
至于其余的,我认为最好使用regexes,即使它是乏味的。您可能需要查看UIMA TextMarker以快速实现正则表达式/规则。
https://stackoverflow.com/questions/16211938
复制相似问题