我有一些从CoreNLP以.conll格式输出的文件,我想将它们反序列化为一个Annotation对象。CoreNLP是否提供了将.conll文件转换为Annotation对象的CONLL-X DocumentReader方法,或者我是否必须创建自己的DocumentReader?
发布于 2016-05-10 06:08:21
您可以尝试像TSVSentenceIterator这样的工具,它从一个类似于CoNLL的格式化的TSV文件中读取句子。
但是,请注意,从Annotation对象挂起的批注数量远远超过CoNLL文件中的列数(例如,字符偏移量等),因此,如果您希望继续批注对象,这种序列化将不会是无损的,并且可能会有意想不到的行为。这不是官方支持的无损序列化策略之一。
https://stackoverflow.com/questions/37115275
复制相似问题