我有一个pandas数据矩阵,如下所示:
Store Sales year month day
0 1 5263 2015 7 31
1 1 5020 2015 7 30
2 1 4782 2015 7 29
3 2 5011 2015 8 28
4 2 6102 2015 9 27
[986159 rows x 5 columns]我需要将数据除以值为8和9的月份,然后将其余的训练数据放在另一个集合中。
我可以这样做,但不管用:
# Dataframe with 8 and 9 months
train_X1 = train[train['month'] == 9 or train['month'] == 8]
# The rest of the data
train_X2 = train[train['month'] != 9 or train['month'] != 8]我可以这样做,但这只会让我在8个月和9个月的时间里得到一部分数据,但其余的数据不会被捕获:
train8 = train[train['month'] == 8]
train9 = train[train['month'] == 9]
train89 = train8 + train9如何将dataframe 拆分成两个部分,其中一个部分具有特定的值,而不对其进行两次拆分?(可能与dataframe.query()或pandas.train_test_split()?)
发布于 2015-11-27 23:58:22
操作的语法不正确,请用以下方式替换上面的拆分。您还需要将每个谓词包装在父类中,并使用“AC.26”(或)和“&”(和)。这将执行适当的拆分。
train_X1 = train[(train['month'] == 9) | (train['month'] == 8)]
train_X2 = train[(train['month'] != 9) & (train['month'] != 8)]https://stackoverflow.com/questions/33966150
复制相似问题