Duration Protocol Direction Label
12 tcp bi normal-V45
2 udp one Botnet-45
2 icmp bi Botnet-68
3 tcp one normal-V73
5 udp bi Background-tcp
3 icmp one Background我希望选择最后一列(标签)为普通或僵尸网络的行。如果标签包含普通/僵尸网络,我必须检查条件(在这里,normal-V45和normal-V73被认为是正常的,类似于僵尸网络的概念)。因此,产出应是:
Duration Protocol Direction Label
12 tcp bi normal-V45
2 udp one Botnet-45
2 icmp bi Botnet-68
3 tcp one normal-V73我在熊猫中使用了下面的内容,但是所有的数据都是在csv中提供的。帮助appreciated.Waiting。提前感谢: data1是所有数据所在的数据,[~data1.iloc:,-1.str是用于选择最后一列的。
datagrouped = data1.loc[~data1.iloc[:,-1].str == 'Botnet']
发布于 2017-10-10 19:27:27
将.str.contans与regex和布尔索引一起使用:
df[df.Label.str.contains(r'normal|Botnet')]输出:
Duration Protocol Direction Label
0 12 tcp bi normal-V45
1 2 udp one Botnet-45
2 2 icmp bi Botnet-68
3 3 tcp one normal-V73https://stackoverflow.com/questions/46674015
复制相似问题