搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

Python list和sklearn HashingVectorizer

我有一个嵌套的python列表，格式如下我需要使用HashingVectorizer()向量化这个列表，但是我不明白应该如何使用vectorizer.fit_transform处理这个列表Xc = vectorizer.fit_transform(npes) 上面的代码会给出以下错误

浏览 0提问于2017-09-11得票数 0

1回答

将HashingVectorizer的结果附加到HashingVectorizer先前结果的末尾

我想做的是在sklearn中使用hashingVectorizer和tfidfTransformer对垃圾邮件过滤器进行增量学习。这是我的密码- messages_bow = HashingVectorizer(analyzer=split_into_lemmas,non_negativespam_detector=MB.partial_fit(messages_tfidf,final[i]['label'],classes=['ham','spam&

浏览 2提问于2017-04-04得票数 2

回答已采纳

2回答

HashingVectorizer后输入形状错误

我使用了特性散列来映射使用HashingVectorizer()的204567单词。我有一个热编码标签，并使用Perceptron()模型来解决这个多类分类问题。from keras.utils import np_utilsfromsklearn.linear_model import Perceptron vect = Has

浏览 0修改于2017-07-17得票数 1

回答已采纳

2回答

HashingVectorizer上的scikit learn- Tfidf

HashingVectorizer的目标是低内存使用率。是否可以首先将一堆文件转换为HashingVectorizer对象(使用pickle.dump)，然后加载所有这些文件并将其转换为TfIdf功能？这些特征可以从HashingVectorizer中计算出来，因为可以存储计数并推断文档的数量。我现在有以下内容： vectorizer = HashingVectorizer(norm=None, non_negative=True) features

浏览 2修改于2016-01-24得票数 3

1回答

SGDClassifier与HashingVectorizer和TfidfTransformer

我想了解是否可以使用SGDClassifier和TfidfTransformer来训练一个在线的HashingVectorizer (用partial_fit)。如果没有，在大型数据集中是否有将HashingVectorizer与tf相结合的替代解决方案？

浏览 7修改于2017-05-23得票数 4

回答已采纳

2回答

TfidfVectorizer toarray()和HashingVectorizer的意义

与散列向量器相反，我有以下代码：# list of text documentstext = ["The quick brown fox jumped over the lazy dog."]vectorizer = HashingVectorizer

浏览 1修改于2019-02-07得票数 0

回答已采纳

1回答

HashingVectorizer与TfidfVectorizer导出文件大小

我正在使用以下代码生成一个模型：text_clf = OnlinePipeline([('vect', HashingVectorizer当我用TfidfVectorizer()替换HashingVectorizer()并重新导出时，我的模型是9kb。为什么会有这样的文件差异，而且无论如何都要减少HashingVectorizer导出的大小。

浏览 3提问于2018-11-28得票数 0

2回答

从滑雪板看不懂HashingVectorizer

我正在使用来自sklearn.feature_extraction.text的HashingVectorizer函数，但我不明白它是如何工作的。我的代码corpus = [ 'This is the first documentvectorizer = HashingVectorizer(n_features=2**3)print(

浏览 0提问于2019-05-23得票数 5

1回答

从HashingVectorizer检索词汇表

因为我遇到了内存错误，所以我决定改用HashingVectorizer。有没有一种方法可以像tfidf_vectorizer.vocabulary_[word]一样获得这个设置中给定单词的向量？

浏览 2提问于2018-08-16得票数 1

2回答

如何在python中使用HashingVectorizer获取特性名称？

如果我使用HashingVectorizer，那么如何获得feature_names？也就是说，哪个列对应于哪个特性？，因为get_feature_names()方法在HashingVectorizer中不可用。

浏览 1修改于2014-04-04得票数 5

4回答

利用HashingVectorizer实现文本矢量化

然后使用一个HashingVectorizer来准备由ML模型处理的文本(我希望将字符串散列为一个唯一的数值，以便ML模型能够在其上进行训练) vectorizer = HashingVectorizer

浏览 0修改于2019-04-07得票数 2

3回答

如何在多项式朴素贝叶斯算法中实现HashingVectorizer

因此，我有一个使用HashingVectorizer的建议。我使用了下面的分类代码(只是用TfidfVectorizer替换HashingVectorizer)vect = HashingVectorizer(stop_words=stop_words, ngram_range=(1,5)) X_train_dtm = vect.fit_transform逻辑是不同的，我不知道

浏览 0修改于2020-01-25得票数 1

1回答

利用HashEmbeddings的思想与sklearn的HashingVectorizer

提出了一种在散列向量器中处理哈希冲突的有趣方法:使用两个不同的散列函数，并在建模之前将其结果连接起来。我想用我正在学习的一些文本数据来尝试这一点。这样做的想法是两次运行，每次使用不同的哈希函数，然后将结果作为输入连接到我的模型中。或者我可以用实现这一点？

浏览 0提问于2018-12-13得票数 4

回答已采纳

1回答

ColumnTransformer在管道中使用CountVectorizer/HashingVectorizer失败(多个文本特性)

类似于这个问题()，我希望在具有文本特性的列上应用CountVectorizer/HashingVectorizer，使用管道中的ColumnTransformer。但是我没有一个文本功能，而是多个。categorical_transformer = Pipeline(steps=[('encoder', OneHotEncoder())]) text_transformer = Pipeline(steps=[('hashing', HashingVectorizer

浏览 1提问于2021-07-14得票数 0

回答已采纳

1回答

如何准确地表示用hashingVectorizer生成的列的SHAP值？

我使用sklearn中的HashingVectorizer()来表示数据集的唯一ID，该数据集将数据散列为n列，并且我希望计算该数据的总SHAP值。

浏览 4提问于2022-06-21得票数 1

2回答

Hashingvectorizer和多项式朴素bayes没有一起工作。

在矢量化步骤中，我想使用Hashingvectorizer()。ValueError: Input X must be non-negative以下是与此错误相关的块代码 vectorizer = HashingVectorizer

浏览 9提问于2016-04-06得票数 6

回答已采纳

1回答

MiniBatchKMeans聚类过程中HashingVectorizer后的记忆错误

Aaron Swartz"from __future__ import print_functionprint("") print("Calculating Term Occurrences...")vectorizer = HashingVectorizer这个错误的一部分，我不明白，因为我认为M

浏览 0提问于2018-09-01得票数 1

1回答

n_gram模型HashingVectorizer及其与keras的结合使用

对于这个purpose.Then，我已经使用了sklearn的HashingVectorizer，我必须使用keras来创建神经网络。但是，我不确定如何输入形状from sklearn.feature_extraction.text import HashingVectorizer from sklearn.neural_network

浏览 11修改于2017-07-20得票数 0

回答已采纳

1回答

TypeError:应为字符串或类似字节的对象HashingVectorizer

=\\s+)' steps = [('vectorizer',HashingVectorizer(TOKENS_ALPHANUMERIC,

浏览 0修改于2018-05-08得票数 1

2回答

scikit-学习:将数据整合到块中，而不是一次将其全部拟合起来。

我现在需要一个简单的词包特征，所以我尝试使用TfidfVectorizer/HashingVectorizer/CountVectorizer来获得特征向量。要用代码来说明这一点，如下所示：train_vectors= vectoriser.fit_transform(train_data)vectoriser = CountVectorizer() # or Tfid

浏览 2修改于2022-10-27得票数 9

回答已采纳

第 2 页第 3 页第 4 页第 5 页

点击加载更多

Python list和sklearn HashingVectorizer

将HashingVectorizer的结果附加到HashingVectorizer先前结果的末尾

HashingVectorizer后输入形状错误

HashingVectorizer上的scikit learn- Tfidf

SGDClassifier与HashingVectorizer和TfidfTransformer

TfidfVectorizer toarray()和HashingVectorizer的意义

HashingVectorizer与TfidfVectorizer导出文件大小

从滑雪板看不懂HashingVectorizer

从HashingVectorizer检索词汇表

如何在python中使用HashingVectorizer获取特性名称？

利用HashingVectorizer实现文本矢量化

如何在多项式朴素贝叶斯算法中实现HashingVectorizer

利用HashEmbeddings的思想与sklearn的HashingVectorizer

ColumnTransformer在管道中使用CountVectorizer/HashingVectorizer失败(多个文本特性)

如何准确地表示用hashingVectorizer生成的列的SHAP值？

Hashingvectorizer和多项式朴素bayes没有一起工作。

MiniBatchKMeans聚类过程中HashingVectorizer后的记忆错误

n_gram模型HashingVectorizer及其与keras的结合使用

TypeError:应为字符串或类似字节的对象HashingVectorizer

scikit-学习:将数据整合到块中，而不是一次将其全部拟合起来。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐