我正在尝试解析一些XML,但是我得到了一个错误消息。看了一下,我怀疑这是由于源文本中的某种特殊字符造成的,应该在我的解析器行中放置一个(recover=True)。然而,我不知道它的确切位置。有没有人可以看一下?
for name in newlist:
tree = ET.parse(loc + name)
root = tree.getroot()
for post in root.findall('post'):
text = post.text
text = text.strip()
posts.append(text) 我得到的错误是:
ParseError: not well-formed (invalid token): line 103, column 225发布于 2013-04-28 22:27:58
我不熟悉python,但我在使用c#时遇到过类似的问题。这可能是因为xml的格式不正确。通常,xml文件的第一行将包含以下内容
<?xml version="1.0" encoding="UTF-8" ?> 版本和编码很重要,因为它告诉解析器允许哪些字符。UTF-8是默认格式,但有时xml文件会包含非ascii字符,这会导致情况变得疯狂。将编码更改为UTF-16有时会修复此问题。
祝好运
https://stackoverflow.com/questions/16263837
复制相似问题