我一直在试验一些NLP文本解析器,但我发现大多数解析器甚至在实际文本中发生的一些最简单的任务中都会失败(没有经过预处理来显示系统有多“棒”。下面是一个示例:
From Sundays until Thursdays every week我还没有找到一个解析器可以正确地解析它。我已经尝试了相当多,包括斯坦福大学的sutime。有没有人推荐可以处理自然文本日期的软件?
发布于 2015-10-04 14:56:27
我去找的时候也没有找到,所以我写了自己的。它是我的.NET自然语言引擎的一部分。
以下是当你输入该短语时演示的内容(限定到下周,而不是每周-它也可以处理,但它是无限的):

一些评论:
1)处理所有可能的英语时间表达是一项艰巨的任务。多年来,我一直在研究这个问题,目的是想出一种简洁的方法来表示时间表达式,以及解析英语时间表达式所需的许多规则。
2)除了找到一种方法来表示典型的日历日期时间和范围之外,你还需要一些方法来表示无限序列,比如“每周一”,以及半无限序列,比如“之前的每个工作日……”。然后你还需要一个代数来组合时态表达式。
3)时间表达在英语中经常是模棱两可的,不同的文化有不同的解释。
4)结果通常必须在句子的上下文和/或对话历史中解释。“谁打电话给星期一的?”是不同于“周一提醒我”的周一,也不同于“显示周一的统计数据”。
https://stackoverflow.com/questions/25251690
复制相似问题