我正在从事一个项目,从短文本(3-4个句子)提取关键字。使用spaCy库,我提取名词短语和NER,并将它们用作关键字。但是,我想根据它们在原始文本中的重要性对它们进行排序。
我尝试了标准的信息检索方法,如tfidf,甚至还有几种基于图形的算法,但由于文本太短,结果并不是很好。
我在想,也许使用带有注意力机制的神经网络可以帮助我对这些关键字进行排名。有没有办法使用spaCy附带的预训练模型来进行某种排名?
发布于 2019-04-17 22:02:39
像最大边际相关性这样的东西怎么样?http://www.cs.cmu.edu/~jgc/publication/The_Use_MMR_Diversity_Based_LTMIR_1998.pdf
https://stackoverflow.com/questions/55716059
复制相似问题