我正在尝试使用Pandas加载CSV:https://www.kaggle.com/miroslavsabo/young-people-survey并训练一个TensorFlow模型。此csv中的一些值来自封闭列表,例如"Smoking“具有可能的值”从未吸烟“、”尝试吸烟“、”当前吸烟者“。
我想要做的是自动为每个值创建一个二进制列,而不是有1列这3个可能的值,我将有3列“从未吸烟”,“尝试吸烟”,“当前吸烟者”,如果原始列中的值与列的名称相同,则每列将填充1,否则将为零。
tensorflow有没有一些自动的方法来使用闭合列表中的值对每一列执行此操作?
发布于 2021-07-05 00:57:27
pandas.get_dummies()是专门为此而设计的。see docs
在您的案例中,它将是(直接从那里获取示例)
clms = pd.Series(list(["never smoked", "tried smoking", "current smoker"]))
your_pd.get_dummies(clms)https://stackoverflow.com/questions/68246716
复制相似问题