问斯坦福NLP输出格式
EN

Stack Overflow用户

提问于 2017-06-12 02:29:27

回答 0查看 762关注 0票数 0

使用Stanford NLP，我希望我的文本经过词汇化和共指解析。

因此，对于input.txt来说：“斯坦福大学位于加州，是一所建于1891年的伟大大学。”我希望output.txt：“斯坦福位于加利福尼亚。斯坦福是一所伟大的大学，成立于1891年。”

我还希望获得一个表，其中第一列由文本中识别的名称实体组成，第二列是它们被标识为的名称类。因此，对于上面的示例句子，它将类似于：

第1列第2列斯坦福位置，组织加州位置

因此，在表中，name-entities只会出现一次。

我在网上找不到任何关于操纵默认xml输出或使用NLP对输入文本文件进行直接更改的内容。你能给我一些关于如何做的建议吗？

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44487269

复制

相似问题

问斯坦福NLP输出格式EN