我有下面的代码,它从CSV文件中提取数据,我想对数据集中的一个变量执行一些分析。该变量是一种对象数据类型,它有很多缺失值。因此,我使用pd.to_numeric将它们转换为NaN。然后我创建了一些bin (1,2,3,4,5)来对variable.However的值进行分类,我希望在新变量("variable_q")中包含NaN作为一个类别或bin。例如“无数据”类别。这有可能吗?我该怎么做?我错过了anything>吗?
import pandas as pd
import numpy as np
data=pd.read_csv("dataset.csv")
data["variable"]=pd.to_numeric(data["variable"],errors="coerce")
data["variable_q"]=pd.cut(x=data["variable"],bins=[1,2,3,4,5],labels=["Low","Moderate","High","Extremely High"])非常感谢!
发布于 2020-08-04 08:48:40
嗯,我正在对变量做一个频率分布,我刚刚意识到在下面的代码中添加dropna=False作为参数可以解决这个问题。
已经创建了NaN类别!所以不需要在上面的代码中添加"No Data“类别。
data"variable_q".value_counts(sort=False,dropna=False)
https://stackoverflow.com/questions/63232132
复制相似问题