首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在单个文档的tfidf矩阵中查找哪个word的tfidf最大?

如何在单个文档的tfidf矩阵中查找哪个word的tfidf最大?
EN

Stack Overflow用户
提问于 2017-06-09 14:13:17
回答 0查看 1.6K关注 0票数 2

我现在使用下面的代码。我已经存储了所有文档的tfidf矩阵,现在我需要一个特定文档的前n个单词?我不知道怎么弄到它?

这是我一直使用到现在的代码。我现在需要从每个tfidf最高的文档中找到单词

代码语言:javascript
复制
import glob
import pandas as pd
import math
filenames=[]
corpus = []
df=pd.DataFrame(columns=['article','similar','score'])
for file in glob.glob("*.txt"):
    with open(file, "r") as paper:
    corpus.append((file, paper.read()))
    filenames.append(file)
from sklearn.feature_extraction.text import TfidfVectorizer

tf = TfidfVectorizer(analyzer='word', ngram_range=(1,1), min_df = 0, stop_words = 'english')
tfidf_matrix =  tf.fit_transform([content for file, content in corpus])
EN

回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44450510

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档