在过去的几天里,我一直在为elasticsearch中索引的文档实现潜在语义分析。第一步是构建term-document matrix.So,我想使用斯坦福nlp库,它将索引作为输入,意思是降低消减,删除停用词,可能是词干并生成矩阵,或者只是可以使用elasticsearch java api来构建它?
发布于 2017-05-20 23:26:20
是的,你可以使用elasticsearch的_analyze端点,对你的文本执行tokenizing/character mapping/stemming/...,然后返回结果。
https://stackoverflow.com/questions/44068238
复制相似问题