在DKpro中已经有很多标记器,比如Stanford,opennlp等,但是我想知道如何在DKpro-core中实现flair NER标记器?
发布于 2020-05-26 23:29:37
现有的DKPro核心集成标记器,如斯坦福、OpenNLP等,要么是基于Java的,要么是兼容Java的。然而,flair NER标记器模型是用python开发的。因此,要将它们与DKPro核心连接起来,需要一个中间件工具。
UIMA CAS处理库DKPro Cassis是用Python (也可以是pypi project)编写的,可以直接使用flair组件,如flair NER标记器。
DKPro Cassis可以导入由DKPro核心组件生成的Cas对象,并使用flair ner提供的标签对SofA进行注释。在注释之后,可以将Cas对象导出回DKPro核心。
PoC正在进行上述分析,很快就会在这里更新。
发布于 2020-08-10 10:33:09
提出了一种将FlairNLP集成到DKPro的PoC:here
如前所述,DKPro生成的归档存储对象是在DKPro cassis的帮助下导入的。FlairNLP对SoFA字符串进行了注释。根据DKPro NER注释映射NER注释。CAS被写回xmi文件,DKPro可以读回该文件以进一步注释。
https://stackoverflow.com/questions/61996723
复制相似问题