这些都与TfidfVectorizer of sklearn有关。
请一些人解释一下这两者之间的异同,以及两者何时有用。
这是相当令人困惑的,因为他们看起来非常相似,但也非常不同。
而且,在这种情况下,有限的sklearn文档也没有多大帮助。
发布于 2019-06-21 17:28:46
基本上,我认为它们包含了完全相同的信息。
然而,如果你有这个术语的名称,并且你在tf-以色列国防军矩阵中寻找它的列位置,那么你就选择.vocabulary_。
.vocabulary_将术语的名称和值作为键,它们在tf-国防军矩阵中的列位置。
然而,如果你知道这个词在tf-以色列国防军矩阵中的列位置,并且你寻找它的名字,那么你就选择.get_feature_names()。
这些术语在.get_feature_names()中的位置与元素在tf-国防军矩阵中的列位置相对应。
https://stackoverflow.com/questions/56707957
复制相似问题