首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用syntaxnet输出

如何使用syntaxnet输出
EN

Stack Overflow用户
提问于 2016-06-17 07:29:16
回答 3查看 5.2K关注 0票数 12

两天前,我开始使用Syntaxnet,我想知道如何使用/导出输出(ascii树或conll )的格式,这种格式易于解析(即: Json、XML、python图)。

谢谢你的帮助!

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2016-06-24 11:38:26

在进入ascii树之前(我认为您正在跟踪demo.sh),输入经过标记和解析。删除命令管道中的最后一步。

修改后的demo.sh文件如下所示:-

代码语言:javascript
复制
PARSER_EVAL=bazel-bin/syntaxnet/parser_eval
MODEL_DIR=syntaxnet/models/parsey_mcparseface
[[ "$1" == "--conll" ]] && INPUT_FORMAT=stdin-conll || INPUT_FORMAT=stdin

$PARSER_EVAL \
  --input=$INPUT_FORMAT \
  --output=stdout-conll \
  --hidden_layer_sizes=64 \
  --arg_prefix=brain_tagger \
  --graph_builder=structured \
  --task_context=$MODEL_DIR/context.pbtxt \
  --model_path=$MODEL_DIR/tagger-params \
  --slim_model \
  --batch_size=1024 \
  --alsologtostderr \
   | \
  $PARSER_EVAL \
  --input=stdin-conll \
  --output=stdout-conll \
  --hidden_layer_sizes=512,512 \
  --arg_prefix=brain_parser \
  --graph_builder=structured \
  --task_context=$MODEL_DIR/context.pbtxt \
  --model_path=$MODEL_DIR/parser-params \
  --slim_model \
  --batch_size=1024 \
  --alsologtostderr \

然后你可以跑:-

代码语言:javascript
复制
$ echo 'Bob brought the pizza to Alice.' | syntaxnet/demo.sh 1>sample.txt 2>dev/null

您的结果将存储在sample.txt中,它看起来如下:-

代码语言:javascript
复制
1   Bob _   NOUN    NNP _   2   nsubj   _   _
2   brought _   VERB    VBD _   0   ROOT    _   _
3   the _   DET DT  _   4   det _   _
4   pizza   _   NOUN    NN  _   2   dobj    _   _
5   to  _   ADP IN  _   2   prep    _   _
6   Alice   _   NOUN    NNP _   5   pobj    _   _
7   .   _   .   .   _   2   punct   _   _

在这里,您可以通过使用\n分割数据,轻松地获得关于每个单词的头、词性和节点类型的信息。

ascii树本身就是通过使用上面的方法构建的。

票数 9
EN

Stack Overflow用户

发布于 2017-01-02 15:11:03

我来这里是为了寻找一个关于词性输出的传说。它是在一个删除的答案中共享的--其他用户可能无法看到。

到目前为止,缩略语的部分似乎与佩恩语音标记部分的句子相匹配。此处引用该表,以防页面下降或发生更改:

  1. CC协调连接
  2. CD基数
  3. DT测定器
  4. 前存在论
  5. FW外来词
  6. 介词或从属连词
  7. JJ形容词
  8. JJR形容词
  9. 形容词,最高级
  10. LS列表项目标记
  11. MD模态
  12. NN名词,单数或质量
  13. 名词,复数
  14. NNP专有名词,单数
  15. NNPS专有名词,复数
  16. PDT预确定器
  17. POS占有式结尾
  18. PRP人称代词
  19. PRP$拥有代词
  20. RB副词
  21. RBR副词,比较
  22. RBS副词,最高级
  23. RP粒子
  24. SYM符号
  25. 转到
  26. 呃感叹
  27. VB动词,基形式
  28. 动词,过去式
  29. 动词、动名词或现在分词
  30. VBN动词,过去分词
  31. 动词,非第三人称单数现在位
  32. VBZ动词,第三人称单数在场
  33. WDT Wh-测定器
  34. Wh-代词
  35. wh-代词
  36. WRB Wh-副词
票数 5
EN

Stack Overflow用户

发布于 2017-04-01 13:34:11

我写了一篇博客文章,解释了如何将任何给定语言的SyntaxNet输出输入到Python,特别是NLTK,并将它的输出与依赖图和树类一起使用。

您可以在这里查看:http://www.davidsbatista.net/blog/2017/03/25/syntaxnet/

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37875614

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档