首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用KeyError时使用sklearn.feature_extraction.text

使用KeyError时使用sklearn.feature_extraction.text
EN

Stack Overflow用户
提问于 2020-11-06 07:41:09
回答 1查看 461关注 0票数 0
代码语言:javascript
复制
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
tfidf = TfidfVectorizer(analyzer='word', stop_words='english')

age_matrix = tfidf.fit_transform(df['age'])

当运行上述代码时,可能会发生以下错误。

这一切为什么要发生?

求你帮帮我。提前谢谢。

/usr/local/lib/python3.6/dist-packages/pandas/core/indexes/base.py in

get_loc(自、键、方法、容忍度) 2895返回self._engine.get_loc(casted_key) 2896,但KeyError作为错误:如果容忍度不是零,则-> 2897从err 2898 2899提升KeyError( key ):

KeyError:“年龄”

我的数据集如下。

代码语言:javascript
复制
        Gender                      product  0
age                                       
18       F                    Bags-Mens  5
18       F                   Bags-Women  4
18       F               Books-Academic  4
18       F               Books-Children  5
18       F                 Books-Comics  7
..     ...                          ... ..
44       M                 Books-Comics  2
44       M                Clothing-Mens  1
44       M               Clothing-Women  1
44       M               Footwear-Women  1
44       M  Home and kitchen-Furnishing  2

[1202 rows x 3 columns]
EN

回答 1

Stack Overflow用户

发布于 2020-11-06 10:42:11

看起来'age‘是数据帧索引(而不是列),所以您不能按df'age’访问它。

您只需将df.index传递给fit_transform方法即可。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64710575

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档