首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >关于数据清理

关于数据清理
EN

Stack Overflow用户
提问于 2022-09-05 16:51:11
回答 1查看 29关注 0票数 0

我是一个非常业余的数据科学学生,我正在做一个项目,在一个基于团队的游戏中,我比较了两个服务器,但是我的两个数据集的格式是不同的。例如,第一列将是第一列,其中一组数据将此信息存储为"blue_team_first_blood“,并存储为”真“或”假“,而另一列则存储为”第一血液“,并存储整数(1用于蓝队,2用于红队,0用于不适用的任何人)

我觉得我可以对这些差异进行编码,但最佳实践是什么呢?我应该采取额外的步骤来确保这两个数据集都被正确地格式化,还是根本没有关系?

EN

回答 1

Stack Overflow用户

发布于 2022-09-06 10:19:17

数据清理通常是任何数据科学项目的第一步。在任何进一步的处理步骤之前,将数据转换成一致的格式是有意义的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73612523

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档