文章/答案/技术大牛

发布

社区首页 >问答首页 >scikit学习train_test_split函数未按预期工作

问scikit学习train_test_split函数未按预期工作
EN

Stack Overflow用户

提问于 2018-12-05 22:47:27

回答 2查看 3.7K关注 0票数 0

我正在使用列车测试拆分函数来分离训练和测试数据，但该函数为分离的列车测试数据分配了错误的标签。它不是从预期行分配标签，而是从预期行的第二行分配标签。请让我知道我哪里错了？

data = pd.read_csv('To_Tanaji.csv')
print(data.columns)
print(data.shape)
#plt.hist(train["DiffCorrectLatRawLat"])
#test = pd.read_csv('test.csv')

#np.polyfit(data['DistanceRaw2GPS'], data['DistanceCorrected2GPS'], 2)
Output= data.DistanceCorrected2GPS
Input=data.DistanceRaw2GPS

X_train, X_test, y_train, y_test = train_test_split(Input, Output, test_size=0.2)

machine-learning

scikit-learn

data-science

回答 2

Stack Overflow用户

发布于 2018-12-06 02:32:18

我不建议关闭train_test_split函数中的shuffle参数，而是为可重复拆分保留random_state变量。随机拆分比拆分数据集的前20%要好，这可能会扭曲您的数据。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(Input, Output, test_size = 0.20, random_state = 0)

如果拆分标签错误，您应该确保输出和输入变量分配正确或不正确。

票数 1

Stack Overflow用户

发布于 2018-12-06 02:06:26

默认情况下，train_test_split函数将对您的数据进行混洗。如果您不想这样做，可以使用shuffle=False。

https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html

如果可能，提供您的输入数据(加扰或未加扰)以重现问题。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53634882

复制

相似问题

问scikit学习train_test_split函数未按预期工作
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问scikit学习train_test_split函数未按预期工作EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问scikit学习train_test_split函数未按预期工作
EN