首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >lxml.objectify不能没有引号解析attrib -需要recover=Ttrue

lxml.objectify不能没有引号解析attrib -需要recover=Ttrue
EN

Stack Overflow用户
提问于 2016-03-23 04:18:51
回答 1查看 688关注 0票数 2

有人对如何使用lxml.objectifyrecover=True有什么建议吗?

我的xml属性没有引用--> name=value,而不是name='value‘。

下面是一些示例代码..。我没有对XML格式的控制,所以我不能回去修改它。etree解析确实有效。

错误是

代码语言:javascript
复制
File "<string>", line unknown
XMLSyntaxError: AttValue: " or ' expected, line 4, column 21

lxml.objectify代码--失败

代码语言:javascript
复制
xmlSample="""<dict>
<maptable>
  <hdterm displevel=1 autlookup entrytype=1>Source term</hdterm>
</maptable>
</dict>"""

如果我没有得到答案,我必须重新

代码语言:javascript
复制
import io
#p = objectify.XMLParser(recover=True)

root = objectify.fromstring(xmlSample)

# returns attributes in element node as dict
attrib = root.getattrib()

# how to extract element data
tbl = root.mytable

print("root.mytable type=%s" % type(tbl))

lxml.etree -工作!

代码语言:javascript
复制
from lxml import etree, objectify

import io
xmlIO = io.StringIO(xmlSample)

p = etree.XMLParser(recover=True)

tree = etree.parse(xmlIO, parser=p)
root = tree.getroot()
print(root.tag)

产出:

代码语言:javascript
复制
myxml
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-23 05:04:16

更新:

结果,您可以将recover=True选项传递给objectify.makeparser()以创建一个解析器,该解析器将尝试恢复格式错误的XML。然后,您可以将创建的解析器传递给objectify.fromstring(),如下所示:

代码语言:javascript
复制
from lxml import etree, objectify

xmlSample="""<dict>
<maptable>
  <hdterm displevel=1 autlookup entrytype=1>Source term</hdterm>
</maptable>
</dict>"""

parser = objectify.makeparser(recover=True)
root = objectify.fromstring(xmlSample, parser)

print(type(root.maptable.hdterm))
# output :
# <type 'lxml.objectify.StringElement'>

初始答案:

您可以将这两个;etreerecover=True组合起来,以修复破损的XML输入,然后将objectify用于解析格式良好的中间XML:

代码语言:javascript
复制
from lxml import etree, objectify

xmlSample="""your_xml_here"""

p = etree.XMLParser(recover=True)
well_formed_xml = etree.fromstring(xmlSample, p)
root = objectify.fromstring(etree.tostring(well_formed_xml))
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36169791

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档