首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于年份的数据分割为3组

基于年份的数据分割为3组
EN

Data Science用户
提问于 2020-01-16 15:09:53
回答 1查看 142关注 0票数 1

假设我们有2015年到2019年的客户数据,我想要train_test_split()我的数据被分成三组,set-1是从2015年到2017年(3年),我将在它上训练我的模型,set-2,即2018年(1年),我将在它上验证我的模型,SE3是2019年(1年),我将在它上测试我的模型。我想要一个根据时间(年数)将数据分成3组的代码。

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-01-16 20:05:05

在我看来,最好(或至少最快)的方法是将所有数据都放在Pandas数据中,然后根据年份创建掩码,并为每个组创建新的数据格式。例如:

代码语言:javascript
复制
train_df = data[data['year'].isin(['2015', '2016', '2017'])
validate_df = data[data['year'] == '2018']
test_df = data[data['year'] == '2019']

希望这就是你要找的。如果没有,请告诉我,我们可以想出另一个解决办法。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/66586

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档