首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在Python中进行xml解析?

如何在Python中进行xml解析?
EN

Stack Overflow用户
提问于 2020-03-17 04:01:42
回答 1查看 36关注 0票数 0

我有一个".odf“文件。

我只想分隔href的“Text/chaair1.xhtml”。

我该怎么做呢?

这是样品。

我有一个".odf“文件。

我只想分隔href的“Text/chaair1.xhtml”。

我该怎么做呢?

这是样品。

代码语言:javascript
复制
<?xml version="1.0" encoding="utf-8"?>
<package version="2.0" unique-identifier="BookId" xmlns="http:/pf">
  <metadata xmlns:dc="http:ts/1.1/" xmlns:opf="ht200pf">
    <dc:identifier opf:scheme="ISBN" id="BookId">urn:19be</dc:identifier>
    <dc:title>samplesample</dc:title>
    <dc:creator />
    <dc:language>ko</dc:language>
    <meta name="cover" content="image" />
    <meta content="0.9.18" name="Sigil version" />
    <dc:date opf:event="modification" xmlns:opf="httopf">2019-12-12</dc:date>
  </metadata>
  <manifest>
    <item id="tocncx" href="toc.ncx" media-type="application/xhtml+xml"/>
    <item id="titlepage" href="Text/titlepage.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter1" href="Text/chapter1.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter2" href="Text/chapter2.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter3" href="Text/chapter3.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter4" href="Text/chapter4.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter5" href="Text/chapter5.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter6" href="Text/chapter6.xhtml" media-type="application/xhtml+xml"/>
  </manifest>
  <spine toc="tocncx">
    <itemref idref="titlepage"/>
    <itemref idref="chapter1"/>
    <itemref idref="chapter2"/>
    <itemref idref="chapter3"/>
    <itemref idref="chapter4"/>
    <itemref idref="chapter5"/>
    <itemref idref="chapter6"/>
  </spine>
</package>
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-03-17 05:37:23

我不知道你想要什么。

代码语言:javascript
复制
from simplified_scrapy import SimplifiedDoc,req,utils
html='''
<?xml version="1.0" encoding="utf-8"?>
<package version="2.0" unique-identifier="BookId" xmlns="http:/pf">
  <metadata xmlns:dc="http:ts/1.1/" xmlns:opf="ht200pf">
    <dc:identifier opf:scheme="ISBN" id="BookId">urn:19be</dc:identifier>
    <dc:title>samplesample</dc:title>
    <dc:creator />
    <dc:language>ko</dc:language>
    <meta name="cover" content="image" />
    <meta content="0.9.18" name="Sigil version" />
    <dc:date opf:event="modification" xmlns:opf="httopf">2019-12-12</dc:date>
  </metadata>
  <manifest>
    <item id="tocncx" href="toc.ncx" media-type="application/xhtml+xml"/>
    <item id="titlepage" href="Text/titlepage.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter1" href="Text/chapter1.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter2" href="Text/chapter2.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter3" href="Text/chapter3.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter4" href="Text/chapter4.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter5" href="Text/chapter5.xhtml" media-type="application/xhtml+xml"/>
    <item id="chapter6" href="Text/chapter6.xhtml" media-type="application/xhtml+xml"/>
  </manifest>
  <spine toc="tocncx">
    <itemref idref="titlepage"/>
    <itemref idref="chapter1"/>
    <itemref idref="chapter2"/>
    <itemref idref="chapter3"/>
    <itemref idref="chapter4"/>
    <itemref idref="chapter5"/>
    <itemref idref="chapter6"/>
  </spine>
</package>'''
doc = SimplifiedDoc(html)
hrefs = doc.manifest.selects('item').select('href()')
print (hrefs)
href = doc.manifest.select("item#chapter1>href()")
print (href)
item = doc.manifest.select("item#chapter1")
print (item)

结果:

代码语言:javascript
复制
['toc.ncx', 'Text/titlepage.xhtml', 'Text/chapter1.xhtml', 'Text/chapter2.xhtml', 'Text/chapter3.xhtml', 'Text/chapter4.xhtml', 'Text/chapter5.xhtml', 'Text/chapter6.xhtml']
Text/chapter1.xhtml
{'id': 'chapter1', 'href': 'Text/chapter1.xhtml', 'media-type': 'application/xhtml+xml', 'tag': 'item'}
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60716085

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档