我有一个巨大的数据集在一个CSV文件的不同型号的汽车销售的国家。CSV图像。
如你所见,在“国家”栏中,我们有这样的条目:“斐济、日本、印度”、“斐济、印度”、“日本、日本”。
我想删除所有在日本没有销售的汽车。因此,删除“斐济、印度”、“印度”和“斐济”等行,将其余的行留给日本。
我如何用Python来完成这个任务呢?
此外,我还想用这样的方式对其进行编码,如果将来数据库中有这样的条目:日本、美国、美国、墨西哥、墨西哥、日本。
然后,它可以自动分类,删除在日本没有出售的汽车。
我对python非常陌生,我正在学习自己编写代码。任何帮助都是可以接受的。
提前感谢!
发布于 2022-07-19 05:28:23
您可以使用Series.str.contains
out = df[df['Country'].str.contains('japan', case=False)]https://stackoverflow.com/questions/73030147
复制相似问题