使用Stanford NLP,我希望我的文本经过词汇化和共指解析。
因此,对于input.txt来说:“斯坦福大学位于加州,是一所建于1891年的伟大大学。”我希望output.txt:“斯坦福位于加利福尼亚。斯坦福是一所伟大的大学,成立于1891年。”
我还希望获得一个表,其中第一列由文本中识别的名称实体组成,第二列是它们被标识为的名称类。因此,对于上面的示例句子,它将类似于:
第1列第2列斯坦福位置,组织加州位置
因此,在表中,name-entities只会出现一次。
我在网上找不到任何关于操纵默认xml输出或使用NLP对输入文本文件进行直接更改的内容。你能给我一些关于如何做的建议吗?
https://stackoverflow.com/questions/44487269
复制相似问题