我正在尝试建立一个新闻标签系统。给出一篇新闻文章,从最能描述文章的新闻文章中找出5-6个关键词。请参考谷歌新闻中的图片。
有什么方法可以让我看到人类可读的标签呢?
发布于 2019-09-06 06:49:26
您可以使用NLP获取标题或新闻内容的标记。标签通常是名词块、实体或标题中提到的动作。您需要执行标准的文本处理步骤,即删除停止词,将句子标记为单词,进行词干处理或柠檬化,然后将其解析以提取信息。其中大多数已经得到执行。查看spaCy或使用NLTK。
您还可以查看SVO (主题、动词、对象模型)来分配标记。SpaCy提供了一种简单的方法来完成这个任务,请检查它。
https://datascience.stackexchange.com/questions/31910
相似问题