我正在使用CoreNLP的命名实体识别注释器。
我的问题是,我不想承认实体的相对日期。我的目标是把日期和事件联系起来。
一些有趣的日期是1997年2月18日、1992年7月20日、今天4天和13日星期一。
在这个例子中,我想强调“1997年2月18日”、“7月20日”和“1992年”。即使其中一些日期没有完成,它们仍然可以用于搜索事件。
另一方面,“从今天起4天”和“13号星期一”对我来说并不有趣:原因是第一天与当前日期(或案文编写日期)有关,而第二天太笼统。
有没有一种简单的方法可以告诉NER注解器放弃相对日期?
谢谢
发布于 2018-03-10 20:10:31
我找到了以下解决方案,在我的情况下效果很好。
表示时间/日期命名实体的每个令牌都有一个包含其规范化形式的注释字段。
我想要识别的绝对日期将具有一个规范化形式,它遵循以下模式:
使用REGEX,可以丢弃没有像这样的规范化形式的注释。
(\d{4}|X{4})((\/\d{2}(\/\d{2})?)?)https://stackoverflow.com/questions/49126827
复制相似问题