首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >转换和映射分类数据

转换和映射分类数据
EN

Stack Overflow用户
提问于 2021-04-09 09:09:11
回答 1查看 29关注 0票数 0

我有一个包含类别列和数值列的数据集。我希望将类别数据转换为数字,并将每种类别映射到特定的数字值。例如,在“教育”栏下,我有高中、本科生、研究生、博士等。如果有人能给我提供将每个代码映射到任意数值的代码,我将不胜感激。

EN

回答 1

Stack Overflow用户

发布于 2021-04-09 09:20:50

代码语言:javascript
复制
import pandas as pd
df = pd.DataFrame(["Highschool", "Undergraduate","Highschool" ,"Graduate", "PHD", "Graduate", "Graduate","Undergraduate"],columns = ["Education"]) 
df_transformed = pd.get_dummies(df)

df_transformed.head()

操作:

代码语言:javascript
复制
 Education_Graduate Education_Highschool    Education_PHD   Education_Undergraduate
0         0               1                    0                0
1         0               0                    0                1
2         0               1                    0                0
3         1               0                    0                0
4         0               0                    1                0

#标签编码

代码语言:javascript
复制
from sklearn import preprocessing
encoder = preprocessing.LabelEncoder()
encoder.fit(df["Education"].values)

#use_any_input_list_here and it will assign a numerical value. I have given a sample list
encoder.transform(["Undergraduate","Highschool" ,"Graduate"])
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67013766

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档