腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(90)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
Python list和sklearn
HashingVectorizer
我有一个嵌套的python列表,格式如下我需要使用
HashingVectorizer
()向量化这个列表,但是我不明白应该如何使用vectorizer.fit_transform处理这个列表Xc = vectorizer.fit_transform(npes) 上面的代码会给出以下错误
浏览 0
提问于2017-09-11
得票数 0
1
回答
将
HashingVectorizer
的结果附加到
HashingVectorizer
先前结果的末尾
我想做的是在sklearn中使用
hashingVectorizer
和tfidfTransformer对垃圾邮件过滤器进行增量学习。这是我的密码- messages_bow =
HashingVectorizer
(analyzer=split_into_lemmas,non_negativespam_detector=MB.partial_fit(messages_tfidf,final[i]['label'],classes=['ham','spam&
浏览 2
提问于2017-04-04
得票数 2
回答已采纳
2
回答
HashingVectorizer
后输入形状错误
我使用了特性散列来映射使用
HashingVectorizer
()的204567单词。我有一个热编码标签,并使用Perceptron()模型来解决这个多类分类问题。from keras.utils import np_utilsfromsklearn.linear_model import Perceptron vect =
Has
浏览 0
修改于2017-07-17
得票数 1
回答已采纳
2
回答
HashingVectorizer
上的scikit learn- Tfidf
HashingVectorizer
的目标是低内存使用率。是否可以首先将一堆文件转换为
HashingVectorizer
对象(使用pickle.dump),然后加载所有这些文件并将其转换为TfIdf功能?这些特征可以从
HashingVectorizer
中计算出来,因为可以存储计数并推断文档的数量。我现在有以下内容: vectorizer =
HashingVectorizer
(norm=None, non_negative=True) features
浏览 2
修改于2016-01-24
得票数 3
1
回答
SGDClassifier与
HashingVectorizer
和TfidfTransformer
我想了解是否可以使用SGDClassifier和TfidfTransformer来训练一个在线的
HashingVectorizer
(用partial_fit)。如果没有,在大型数据集中是否有将
HashingVectorizer
与tf相结合的替代解决方案?
浏览 7
修改于2017-05-23
得票数 4
回答已采纳
2
回答
TfidfVectorizer toarray()和
HashingVectorizer
的意义
与散列向量器相反,我有以下代码:# list of text documentstext = ["The quick brown fox jumped over the lazy dog."]vectorizer =
HashingVectorizer
浏览 1
修改于2019-02-07
得票数 0
回答已采纳
1
回答
HashingVectorizer
与TfidfVectorizer导出文件大小
我正在使用以下代码生成一个模型:text_clf = OnlinePipeline([('vect',
HashingVectorizer
当我用TfidfVectorizer()替换
HashingVectorizer
()并重新导出时,我的模型是9kb。为什么会有这样的文件差异,而且无论如何都要减少
HashingVectorizer
导出的大小。
浏览 3
提问于2018-11-28
得票数 0
2
回答
从滑雪板看不懂
HashingVectorizer
我正在使用来自sklearn.feature_extraction.text的
HashingVectorizer
函数,但我不明白它是如何工作的。我的代码corpus = [ 'This is the first documentvectorizer =
HashingVectorizer
(n_features=2**3)print(
浏览 0
提问于2019-05-23
得票数 5
1
回答
从
HashingVectorizer
检索词汇表
因为我遇到了内存错误,所以我决定改用
HashingVectorizer
。有没有一种方法可以像tfidf_vectorizer.vocabulary_[word]一样获得这个设置中给定单词的向量?
浏览 2
提问于2018-08-16
得票数 1
2
回答
如何在python中使用
HashingVectorizer
获取特性名称?
如果我使用
HashingVectorizer
,那么如何获得feature_names?也就是说,哪个列对应于哪个特性?,因为get_feature_names()方法在
HashingVectorizer
中不可用。
浏览 1
修改于2014-04-04
得票数 5
4
回答
利用
HashingVectorizer
实现文本矢量化
然后使用一个
HashingVectorizer
来准备由ML模型处理的文本(我希望将字符串散列为一个唯一的数值,以便ML模型能够在其上进行训练) vectorizer =
HashingVectorizer
浏览 0
修改于2019-04-07
得票数 2
3
回答
如何在多项式朴素贝叶斯算法中实现
HashingVectorizer
因此,我有一个使用
HashingVectorizer
的建议。我使用了下面的分类代码(只是用TfidfVectorizer替换
HashingVectorizer
)vect =
HashingVectorizer
(stop_words=stop_words, ngram_range=(1,5)) X_train_dtm = vect.fit_transform逻辑是不同的,我不知道
浏览 0
修改于2020-01-25
得票数 1
1
回答
利用HashEmbeddings的思想与sklearn的
HashingVectorizer
提出了一种在散列向量器中处理哈希冲突的有趣方法:使用两个不同的散列函数,并在建模之前将其结果连接起来。我想用我正在学习的一些文本数据来尝试这一点。这样做的想法是两次运行,每次使用不同的哈希函数,然后将结果作为输入连接到我的模型中。或者我可以用实现这一点?
浏览 0
提问于2018-12-13
得票数 4
回答已采纳
1
回答
ColumnTransformer在管道中使用CountVectorizer/
HashingVectorizer
失败(多个文本特性)
类似于这个问题(),我希望在具有文本特性的列上应用CountVectorizer/
HashingVectorizer
,使用管道中的ColumnTransformer。但是我没有一个文本功能,而是多个。categorical_transformer = Pipeline(steps=[('encoder', OneHotEncoder())]) text_transformer = Pipeline(steps=[('hashing',
HashingVectorizer
浏览 1
提问于2021-07-14
得票数 0
回答已采纳
1
回答
如何准确地表示用
hashingVectorizer
生成的列的SHAP值?
我使用sklearn中的
HashingVectorizer
()来表示数据集的唯一ID,该数据集将数据散列为n列,并且我希望计算该数据的总SHAP值。
浏览 4
提问于2022-06-21
得票数 1
2
回答
Hashingvectorizer
和多项式朴素bayes没有一起工作。
在矢量化步骤中,我想使用
Hashingvectorizer
()。ValueError: Input X must be non-negative以下是与此错误相关的块代码 vectorizer =
HashingVectorizer
浏览 9
提问于2016-04-06
得票数 6
回答已采纳
1
回答
MiniBatchKMeans聚类过程中
HashingVectorizer
后的记忆错误
Aaron Swartz"from __future__ import print_functionprint("") print("Calculating Term Occurrences...")vectorizer =
HashingVectorizer
这个错误的一部分,我不明白,因为我认为M
浏览 0
提问于2018-09-01
得票数 1
1
回答
n_gram模型
HashingVectorizer
及其与keras的结合使用
对于这个purpose.Then,我已经使用了sklearn的
HashingVectorizer
,我必须使用keras来创建神经网络。但是,我不确定如何输入形状from sklearn.feature_extraction.text import
HashingVectorizer
from sklearn.neural_network
浏览 11
修改于2017-07-20
得票数 0
回答已采纳
1
回答
TypeError:应为字符串或类似字节的对象
HashingVectorizer
=\\s+)' steps = [('vectorizer',
HashingVectorizer
(TOKENS_ALPHANUMERIC,
浏览 0
修改于2018-05-08
得票数 1
2
回答
scikit-学习:将数据整合到块中,而不是一次将其全部拟合起来。
我现在需要一个简单的词包特征,所以我尝试使用TfidfVectorizer/
HashingVectorizer
/CountVectorizer来获得特征向量。要用代码来说明这一点,如下所示:train_vectors= vectoriser.fit_transform(train_data)vectoriser = CountVectorizer() # or Tfid
浏览 2
修改于2022-10-27
得票数 9
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
点击加载更多
领券