问已知行和未知行的数据分区
EN

Stack Overflow用户

提问于 2019-07-22 18:01:44

回答 1查看 13关注 0票数 0

我有一个包含已知和未知变量的数据集(只有一列)。我想为两个列表分开行-第一个列表包含所有已知变量的行，第二个列表包含所有丢失(未知)变量的行。

df = {'Id' : [1, 2, 3, 4, 5],
     'First' : [30, 22, 18, 49, 22],
     'Second' : [80, 28, 16, 56, 30],
     'Third' : [14, None, None, 30, 27],
     'Fourth' : [14, 85, 17, 22, 14],
     'Fifth' : [22, 33, 45, 72, 11]}
df = pd.DataFrame(df, columns = ['Id', 'First', 'Second', 'Third', 'Fourth'])
df

包含所有已知变量的两个单独列表和包含未知变量的另一个列表

dataframe

python-3.x

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-07-22 18:43:24

如果有帮助，请让我知道：

df['TF']= df.isnull().any(axis=1)


df_without_none  = df[df['TF'] == 0]
df_with_none  = df[df['TF'] == 1]


print(df_without_none.head())
print(df_with_none.head())


#### Input ####

   Id  First  Second  Third  Fourth  Fruit Total     TF
0   1     30      80   14.0      14        124.0  False
1   2     22      28    NaN      85         50.0   True
2   3     18      16    NaN      17         34.0   True
3   4     49      56   30.0      22        135.0  False
4   5     22      30   27.0      14         79.0  False

#### Output ####

   Id  First  Second  Third  Fourth  Fruit Total     TF
0   1     30      80   14.0      14        124.0  False
3   4     49      56   30.0      22        135.0  False
4   5     22      30   27.0      14         79.0  False
   Id  First  Second  Third  Fourth  Fruit Total    TF
1   2     22      28    NaN      85         50.0  True
2   3     18      16    NaN      17         34.0  True

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57143535

复制

相似问题

问已知行和未知行的数据分区
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问已知行和未知行的数据分区EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问已知行和未知行的数据分区
EN