首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >弄清楚不同的CoNLL格式

弄清楚不同的CoNLL格式
EN

Stack Overflow用户
提问于 2017-12-12 14:33:14
回答 0查看 115关注 0票数 0

我正在尝试从Stanford Core NLP生成一个conll文件,然后可以将其用作Semafor的输入(因为semafor只接受conll文件)。

生成的文件如下所示:

代码语言:javascript
复制
1   My  my  PRP$    O   2   nmod:poss
2   kitchen kitchen NN  O   5   nsubj
3   no  no  RB  O   4   neg
4   longer  longer  RB  O   5   advmod
5   smells  smell   VBZ O   0   ROOT
6   .   .   .   O   5   punct

当我使用此文件时,Semafor服务器返回illegalArgument异常,因为格式略有不同。他们的示例conll文件如下所示:

代码语言:javascript
复制
1   My  _   PRP$    PRP$    _   2   NMOD    _   _
2   kitchen _   NN  NN  _   5   SBJ _   _
3   no  _   RB  RB  _   5   ADV _   _
4   longer  _   RB  RB  _   3   AMOD    _   _
5   smells  _   VBZ VBZ _   0   ROOT    _   _
6   .   _   .   .   _   5   P   _   _

似乎我可以通过定义键来控制输出。缺省键为ID、FORM、LEMMA、POSTAG、NER、HEAD、DEPREL。但是,我不知道Semafor提供的示例conll文件的密钥。请指导我如何将生成的文件格式转换为Semafor文件格式。

EN

回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47766598

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档