我正在构建一个信息抽取的语料库,用于提取特定类型的信息,并且我正在努力决定对实体进行注释的最佳方法。我发现IEER语料库使用SGML标记元素ENAMEX、NUMEX和TIMEX标记(如这里所描述的:task.html)。由于本文档是在1997年编写的,我猜想使用这种基于SGML的方法已经过时了,因此必须有更好的方法来实现这一点,例如使用OWL、RDF或XML。是否有更新的行业标准来注释信息抽取语料库?
发布于 2017-05-22 16:51:52
https://stackoverflow.com/questions/44061707
复制相似问题