首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TfidfVectorizer d型失配

TfidfVectorizer d型失配
EN

Stack Overflow用户
提问于 2014-04-01 02:58:56
回答 1查看 477关注 0票数 1

我试着在语料库上使用TfidfVectorizer,但是每次我遇到这个错误

代码语言:javascript
复制
File "sparsefuncs.pyx", line 117, in sklearn.utils.sparsefuncs.inplace_csr_row_normalize_l2 (sklearn\utils\sparsefuncs.c:2328)
ValueError: Buffer dtype mismatch, expected 'int' but got 'long long'

这是我的密码

代码语言:javascript
复制
corpus = []
testCorpus = []
trainType = []
testType = []

with open("stone_sku.csv") as f:
    cr = csv.DictReader(f)
    for row in cr:
        corpus.append(row['sku'])
        trainType.append(row['sku'])

with open("stone_sku.csv") as f:
    crTest = csv.DictReader(f)
    for row in crTest:
        testCorpus.append(row['sku'])
        testType.append(row['sku'])

cv = TfidfVectorizer(min_df=1, analyzer='char', ngram_range=(2,3))

trainCounts = cv.fit_transform(corpus)

它在CountVectorizer中运行良好,如果我尝试使用TfidfTransformer转换数据,也会发生相同的错误。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-04-01 07:37:19

您运行64位Windows吗?这可能是由最近在主分支中解决的一个已知问题引起的。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22775997

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档