首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将数据划分为培训和验证集

将数据划分为培训和验证集
EN

Data Science用户
提问于 2021-06-14 16:16:05
回答 1查看 35关注 0票数 0

我有一个多感官数据集,用于日常生活的活动。它包含10名志愿者的数据,每个志愿者执行9项活动。每位志愿者身上都装有6个传感器,记录的数据类型为四元数、加速度和角速度。对于每个志愿者,我总共有7个CSV文件I-e6为每个传感器和一个用于注释。

现在,我想将7名志愿者的数据分为培训和验证,其余3名进行测试。对于7名志愿者,我总共有将近49个CSV文件。

应该采取什么必要的方法将这些划分为培训和验证集?我可以找到很多关于一个CSV文件的信息,但不是关于这些文件。

我期待着得到一些建议。

EN

回答 1

Data Science用户

发布于 2021-06-15 10:32:07

如果每个志愿者的数据具有相同的格式,那么您可以按照以下方式进行。

第一步

将每个志愿者的7个CSV合并成一个CSV。按列合并这些CSV(不要附加行)。我假设传感器数据列是特性(X),注释列/列是目标(y)。现在你有10辆CSV,每个志愿者一辆。

第二步

合并CSV以创建最终的培训和验证集。现在,您可以将7名CSV(7名志愿者)和3名CSV(3名志愿者)(按行排列)合并(按行排列)。这就是你将如何得到一个单一的CSV的培训和一个单一的CSV测试。

这两个步骤都可以很容易地使用python大熊猫库中的各种功能来完成。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/96623

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档