from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
tfidf = TfidfVectorizer(analyzer='word', stop_words='english')
age_matrix = tfidf.fit_transform(df['age'])当运行上述代码时,可能会发生以下错误。
这一切为什么要发生?
求你帮帮我。提前谢谢。
/usr/local/lib/python3.6/dist-packages/pandas/core/indexes/base.py in
get_loc(自、键、方法、容忍度) 2895返回self._engine.get_loc(casted_key) 2896,但KeyError作为错误:如果容忍度不是零,则-> 2897从err 2898 2899提升KeyError( key ):
KeyError:“年龄”
我的数据集如下。
Gender product 0
age
18 F Bags-Mens 5
18 F Bags-Women 4
18 F Books-Academic 4
18 F Books-Children 5
18 F Books-Comics 7
.. ... ... ..
44 M Books-Comics 2
44 M Clothing-Mens 1
44 M Clothing-Women 1
44 M Footwear-Women 1
44 M Home and kitchen-Furnishing 2
[1202 rows x 3 columns]发布于 2020-11-06 10:42:11
看起来'age‘是数据帧索引(而不是列),所以您不能按df'age’访问它。
您只需将df.index传递给fit_transform方法即可。
https://stackoverflow.com/questions/64710575
复制相似问题