有没有一种方法可以忽略elementtree.ElementTree中阶段名称中的XML名称空间?
我尝试打印所有technicalContact标记:
for item in root.getiterator(tag='{http://www.example.com}technicalContact'):
print item.tag, item.text我得到了一些类似的东西:
{http://www.example.com}technicalContact blah@example.com但我真正想要的是:
technicalContact blah@example.com有没有办法只显示后缀(sans xmlns),或者在不显式声明xmlns的情况下更好地迭代元素?
发布于 2012-06-27 21:25:57
您可以定义一个生成器来递归地搜索您的元素树,以便找到以适当的标记名称结尾的标记。例如,如下所示:
def get_element_by_tag(element, tag):
if element.tag.endswith(tag):
yield element
for child in element:
for g in get_element_by_tag(child, tag):
yield g这只检查以tag结尾的标签,即忽略任何前导名称空间。然后,您可以遍历任何您想要的标记,如下所示:
for item in get_element_by_tag(elemettree, 'technicalContact'):
...这个生成器正在运行:
>>> xml_str = """<root xmlns="http://www.example.com">
... <technicalContact>Test1</technicalContact>
... <technicalContact>Test2</technicalContact>
... </root>
... """
xml_etree = etree.fromstring(xml_str)
>>> for item in get_element_by_tag(xml_etree, 'technicalContact')
... print item.tag, item.text
...
{http://www.example.com}technicalContact Test1
{http://www.example.com}technicalContact Test2发布于 2012-06-27 21:00:24
我总是以这样的方式结束
item.tag.split("}")[1][0:]https://stackoverflow.com/questions/11226247
复制相似问题