对Python非常陌生,所以请耐心听我说。
我希望使用Python过滤Excel电子表格,并在下面提供了一个示例来帮助解释。对于上下文,我使用Pandas来拉入文件。
我已经列出了两列:材料和这些材料是用来制作的。本质上,我希望将电子表格简化为只看到用于制造房屋和汽车的材料(即,不是其中之一)。
任何帮助都将不胜感激。
发布于 2018-11-01 08:01:35
欢迎来到SO!将来,请提供示例输入数据、所需的输出以及您所做的任何代码尝试。
如果我理解正确的话,这是一种你可以实现目标的方法。
import pandas as pd
data = pd.DataFrame(
{
'material': ['wood', 'metal', 'metal', 'glass', 'glass', 'tyres'],
'uses': ['house', 'house', 'car', 'house', 'car', 'car']
}
)我们的数据集:
material uses
0 wood house
1 metal house
2 metal car
3 glass house
4 glass car
5 tyres car然后:
data.groupby('material').agg(', '.join)[(grouped['uses'].str.contains('house')) & (grouped['uses'].str.contains('car'))]首先,我们按material进行分组,并创建一个包含使用该材料制作的所有物品的字符串。这将创建一个数据帧。然后,我们可以应用两个布尔条件来测试构造的字符串中是否存在house和car。
结果:
material uses
glass house, car
metal house, carhttps://stackoverflow.com/questions/53092243
复制相似问题