文章/答案/技术大牛

发布

社区首页 >问答首页 >Python xml.etree转义

问Python xml.etree转义
EN

Stack Overflow用户

提问于 2017-01-22 22:47:43

回答 2查看 3.1K关注 0票数 1

在使用python的xml.etree模块时，我如何转义xml--例如‘'>’‘和'<’这样的特殊字符，以便在标记中使用？我必须手动这样做吗？埃特里有没有我所缺少的方法或权杖？

考虑：

In [1]: from xml.etree.ElementTree import Element, SubElement, tostring

In [2]: root = Element('filter')

In [3]: root.set('type', 'test')

In [4]: for op in ['<', '>', '=']:
   ...:     sub_elem = SubElement(root, op)
   ...:     child = Element('a')
   ...:     child.text = 'b'
   ...:     sub_elem.append(child)
   ...:

In [5]: tostring(root)
Out[5]: '<filter type="test"><<><a>b</a></<><>><a>b</a></>><=><a>b</a></=></filter>'

在这里，我希望看到这样的章节：

<&lt><a>b</a></&lt>

elementtree

python

xml

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-01-23 16:01:24

在这里，我希望看到这样的章节： <&lt><a>b</a></&lt>

这不是格式良好的XML。我想你忘了分号，但是加分号没有帮助。下列情况也是不正确的：

<&lt;><a>b</a></&lt;>

在代码中，您试图创建名为<、>和=的元素。那不管用。在XML元素名称中禁止使用以下所有内容：<、>、=、>、<。

不幸的是，ElementTree有点松懈，允许您创建伪XML，如下所示：

<filter type="test"><<><a>b</a></<><>><a>b</a></>><=><a>b</a></=></f‌ilter>

如果您使用的是lxml.etree (参见http://lxml.de)而不是xml.etree.ElementTree，您将收到一条错误消息："ValueError:无效标签名u'<'“。

票数 1

Stack Overflow用户

发布于 2017-01-22 23:50:03

<和>在XML中是无效字符，应该分别用<和>代替。

可以使用正则表达式替换无效字符：

import re

regexp = re.compile(r'<|>')  # here we are making a regex to catch either the character '<' or '>'
replacement_map = {'<': '&lt;', '>': '&gt;'}  # a dict to map a character to the replacement value.
regexp.sub(lambda match: replacement_map[match.group(0)], '<a>hello</a>')  # do the replacement

# output: '&lt;a&gt;hello&lt;/a&gt;'

虽然代码涉及的范围更长一些，但它是一种非常有效的替换方法。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/41797005

复制

相似问题

问Python xml.etree转义
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python xml.etree转义EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python xml.etree转义
EN