我想使用textacy来提取关键字,但是我使用的keyterms.key_terms.pagerank(文档)函数只是返回一个空列表。
我尝试了相关的功能,包括较长的keyterms.key_terms_from_semantic_network(文档),但没有成功。我还尝试使用比下面显示的更长的文本片段,但仍然找不到任何关键术语。textacy中的其他函数似乎也能正常工作,所以这似乎只是keyterms类的问题。
import spacy
import textacy
test_string = "Textacy key term extraction is not working properly. Textacy is built on top of SpaCy."
doc = textacy.make_spacy_doc(test_string)
textacy.keyterms.textrank(doc)我得到的是一个空列表,而不是一个包含术语和排名分数的元组列表。
发布于 2019-12-21 01:53:49
这对我很管用
请注意以下新增内容:
import spacy
from textacy import keyterms
test_string = "Textacy key term extraction is not working properly. Textacy is built on top of SpaCy."
doc = textacy.make_spacy_doc(test_string, lang='en_core_web_sm')
textacy.keyterms.textrank(doc)这是我从你的例句中得到的结果:
[('term', 0.24594541923542018),
('textacy', 0.24594541923542018),
('extraction', 0.2390545807645797),
('key', 0.13452729038228986),
('spacy', 0.13452729038228986)]发布于 2021-06-10 11:13:34
下面是一个示例,使用2021年6月的最新版本:
import spacy
from textacy.extract import keyterms as kt
test_string = "Textacy key term extraction is not working properly. Textacy is built on top of SpaCy."
doc = textacy.make_spacy_doc(test_string, lang='en_core_web_sm')
kt.textrank(doc)https://stackoverflow.com/questions/56385478
复制相似问题