问题不在于如何发现关键短语。它是关于检测一个词的组合是否是一个有效的短语。例如,
“约翰在纽约读”纽约时报“
在这里,短语是
纽约时报
关键词短语的检测是一个文本总结问题,但本文对组合词是否为有效短语进行了分类。
有一些算法我们已经通过包括但不限于models.phrases短语(搭配)检测的Gensim,然而,我们正在寻找更好的结果。
发布于 2018-09-04 15:58:36
您想要做的事情的名称是Named Entity Recognition (NER)。这方面有几个很好的软件包,即:
发布于 2018-07-06 13:11:07
我会用斯坦福·帕瑟来识别这些短语。它是一种识别句子语法结构并进行句法分析的工具。它在java、python、php、Ruby、C#中都有可用的库(我猜其中至少有一个对您有用)。几年前我就在Java中使用过它,我对它的准确性感到非常满意。
您可以了解更多关于它的这里,它还允许您通过这链接在线试用它(它目前正在运行,但通常正在运行)。
https://datascience.stackexchange.com/questions/34086
复制相似问题