每当名称的末尾有Z-时,我都会尝试更改父标记内的名称的值。通过从我的表中获取值,假设只有三种这样的模式,名称以Z结尾-并且我有值要在列表val中更新。
我该怎么做呢?
假设这是我的XML,
<parent name="A-6/Z-9/B-64/Z-12">
<item>
<list>
<p name="A">
<p name ="B">
</list>
</item>
</parent>
<parent name="A1/Zh/B/C-12">
<item>
<list>
<p name="A">
<p name ="B">
</list>
</item>
</parent>
<parent name="AS-5/ZD-9/B-67/Z-13">
<item>
<list>
<p name="A">
<p name ="B">
</list>
</item>
</parent>
<parent name="An4/Zd-8/B-5/C-13">
<item>
<list>
<p name="A">
<p name ="B">
</list>
</item>
</parent>
<parent name="A-76/Z-8/B-56/Z-14">
<item>
<list>
<p name="A">
<p name ="B">
</list>
</item>
</parent>
<parent name="A-45/Z-ty/B-9/C-14">
<item>
<list>
<p name="A">
<p name ="B">
</list>
</item>
</parent>这是我在列表val = ["Z-99","Z-98","Z-97"]中的值
我希望在我的XML中固定这些值,因为只要父级的name以Z结尾,例如
<parent name="A-6/Z-9/B-64/Z-12">
<parent name="AS-5/ZD-9/B-67/Z-13">
<parent name="A-76/Z-8/B-56/Z-14">我想要这个
<parent name="A-6/Z-9/B-64/Z-99">
<parent name="AS-5/ZD-9/B-67/Z-98">
<parent name="A-76/Z-8/B-56/Z-97">我试过了,但都不管用
pattern = re.compile(r'[A-Z]+-+[0-9]+/+Z+-+[0-9]$')
for i in soup.find_all('parent', distName=pattern):
for j in val:
i.string = i.string[:-2]+str(j)
for i, val in zip(soup.select('parent > name^="Z-"')
i.string = i.string[:-2]+str(val)发布于 2020-08-21 01:35:54
您可以尝试使用此脚本更改<parent>标记中所有必需的name=属性:
from bs4 import BeautifulSoup
txt = '''<parent name="A-6/Z-9/B-64/Z-12">
<item>
<list>
<p name="A"></p>
<p name="B"></p>
</list>
</item>
</parent>
<parent name="A1/Zh/B/C-12">
<item>
<list>
<p name="A"></p>
<p name="B"></p>
</list>
</item>
</parent>
<parent name="AS-5/ZD-9/B-67/Z-13">
<item>
<list>
<p name="A"></p>
<p name="B"></p>
</list>
</item>
</parent>
<parent name="An4/Zd-8/B-5/C-13">
<item>
<list>
<p name="A"></p>
<p name="B"></p>
</list>
</item>
</parent>
<parent name="A-76/Z-8/B-56/Z-14">
<item>
<list>
<p name="A"></p>
<p name="B"></p>
</list>
</item>
</parent>
<parent name="A-45/Z-ty/B-9/C-14">
<item>
<list>
<p name="A"></p>
<p name="B"></p>
</list>
</item>
</parent>'''
soup = BeautifulSoup(txt, 'html.parser')
values = ["Z-99","Z-98","Z-97"]
r = re.compile(r'Z-\d+$')
for parent, new_val in zip(soup.find_all('parent', {'name': r}), values):
parent['name'] = r.sub(new_val, parent['name'])
print(soup.prettify())打印:
<parent name="A-6/Z-9/B-64/Z-99">
<item>
<list>
<p name="A">
</p>
<p name="B">
</p>
</list>
</item>
</parent>
<parent name="A1/Zh/B/C-12">
<item>
<list>
<p name="A">
</p>
<p name="B">
</p>
</list>
</item>
</parent>
<parent name="AS-5/ZD-9/B-67/Z-98">
<item>
<list>
<p name="A">
</p>
<p name="B">
</p>
</list>
</item>
</parent>
<parent name="An4/Zd-8/B-5/C-13">
<item>
<list>
<p name="A">
</p>
<p name="B">
</p>
</list>
</item>
</parent>
<parent name="A-76/Z-8/B-56/Z-97">
<item>
<list>
<p name="A">
</p>
<p name="B">
</p>
</list>
</item>
</parent>
<parent name="A-45/Z-ty/B-9/C-14">
<item>
<list>
<p name="A">
</p>
<p name="B">
</p>
</list>
</item>
</parent>https://stackoverflow.com/questions/63509471
复制相似问题