文章/答案/技术大牛

发布

问过采样数据显示0
EN

Stack Overflow用户

提问于 2020-11-29 18:31:40

回答 1查看 54关注 0票数 0

我正在处理我的数据集，并且对此非常陌生。以下是代码：

class_col_name='Creditability' 

feature_names=df.columns[df.columns != class_col_name ]
# 70% training and 30% test
X_train, X_test, y_train, y_test = train_test_split(df.loc[:, feature_names], df[class_col_name], test_size=0.3,random_state=1) 
print("Number transactions X_train dataset: ", X_train.shape) 
print("Number transactions y_train dataset: ", y_train.shape) 
print("Number transactions X_test dataset: ", X_test.shape) 
print("Number transactions y_test dataset: ", y_test.shape) 

print("Before OverSampling, counts of label '1': {}".format(sum(y_train == 1))) 
print("Before OverSampling, counts of label '0': {} \n".format(sum(y_train == 0)))

我试图在我的数据集上应用过采样，但是当我在过度采样之前对它进行计数时，它在输出中表示为0，但它确实显示了dataset有数据：

以下是产出：

Number transactions X_train dataset:  (700, 20)
Number transactions y_train dataset:  (700,)
Number transactions X_test dataset:  (300, 20)
Number transactions y_test dataset:  (300,)
Before OverSampling, counts of label '1': 0
Before OverSampling, counts of label '0': 0

我正在努力理解输出，并对其进行研究。

classification

oversampling

smote

python

machine-learning

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-11-29 18:39:02

您可能需要确认可能的类标签实际上是0和1。

print(y_train.unique())

检查类标签是什么。

如果y_train是一个标有0，1标签的熊猫系列，那么我相信最后两行的结果实际上应该与y_train的大小相加。如果标签不在整数0或1中，那就解释了为什么和都是0。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/65063683

复制

相似问题

问过采样数据显示0
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问过采样数据显示0EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问过采样数据显示0
EN