目前,我正试图统一rpm包中的许可证名称。
因此,我解析rpms,以列表的形式获取许可信息,并希望将这些列表与我构建的查找表进行比较。
下面是一个示例:
lic = ['GPLv2', ' & ', 'LGPLv2+', ' & ', 'LGPLv2.1+', ' | ', 'LGPLv3+']
duplicates = (
('GPL-2.0', 'GPL-2', 'GPLv2', 'GPLv2.0'),
('GPL-2.0+', 'GPL-2+', 'GPLv2+', 'GPLv2.0+'),
('GPL-3.0', 'GPL-3', 'GPLv3', 'GPLv3.0'),
('GPL-3.0+', 'GPL-3+', 'GPLv3+', 'GPLv3.0+'),
('LGPL-2.0', 'LGPLv2.0', 'LGPLv2', 'LGPL2'),
('LGPL-2.0+', 'LGPLv2.0+', 'LGPLv2+', 'LGPL2+'),
('LGPL-2.1', 'LGPLv2.1', 'LGPL2.1'),
('LGPL-2.1+', 'LGPLv2.1+', 'LGPL2.1+'),
('LGPL-3.0', 'LGPLv3.0', 'LGPLv3', 'LGPL3'),
('LGPL-3.0+', 'LGPLv3.0+', 'LGPLv3+', 'LGPL3+')
)用每个元组的对应的第一个元素替换duplicates中所有元素的最有效和最重要的方法是什么?
GPLv2需要被GPL-2.0取代,LGPLv2+需要被LGPL-2.0+所取代,等等。
我正在使用Python 3.5.2
发布于 2018-11-27 13:47:25
您可以迭代您的lic,并将其每个元素与duplicates进行比较,如果发现匹配,则用匹配元组的第一个元素替换该元素。
lic = ['GPLv2', ' & ', 'LGPLv2+', ' & ', 'LGPLv2.1+', ' | ', 'LGPLv3+']
duplicates = (
('GPL-2.0', 'GPL-2', 'GPLv2', 'GPLv2.0'),
('GPL-2.0+', 'GPL-2+', 'GPLv2+', 'GPLv2.0+'),
('GPL-3.0', 'GPL-3', 'GPLv3', 'GPLv3.0'),
('GPL-3.0+', 'GPL-3+', 'GPLv3+', 'GPLv3.0+'),
('LGPL-2.0', 'LGPLv2.0', 'LGPLv2', 'LGPL2'),
('LGPL-2.0+', 'LGPLv2.0+', 'LGPLv2+', 'LGPL2+'),
('LGPL-2.1', 'LGPLv2.1', 'LGPL2.1'),
('LGPL-2.1+', 'LGPLv2.1+', 'LGPL2.1+'),
('LGPL-3.0', 'LGPLv3.0', 'LGPLv3', 'LGPL3'),
('LGPL-3.0+', 'LGPLv3.0+', 'LGPLv3+', 'LGPL3+')
)
for idx, i in enumerate(lic):
for match in duplicates:
if i in match:
lic[idx] = match[0]
break
print(lic)输出:
['GPL-2.0', ' & ', 'LGPL-2.0+', ' & ', 'LGPL-2.1+', ' | ', 'LGPL-3.0+']发布于 2018-11-27 13:42:22
我会首先将元组的duplicates元组修改为dict。就像这样:
duplicates = {k: v for k, *v in duplicates} # {'GPL-2.0': ['GPL-2', 'GPLv2', 'GPLv2.0'], ...}然后做:
lic_clean = [next((k for k, v in duplicates.items() if x in v), x) for x in lic]它产生:
['GPL-2.0', ' & ', 'LGPL-2.0+', ' & ', 'LGPL-2.1+', ' | ', 'LGPL-3.0+']https://stackoverflow.com/questions/53500942
复制相似问题