首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用jpedal从html中提取超链接?--java

使用jpedal从html中提取超链接?--java
EN

Stack Overflow用户
提问于 2011-10-06 03:21:26
回答 1查看 165关注 0票数 0

java中的JPedal库通常用于将pdf转换为XML或HTML。然而,我需要知道我们是否可以使用JPedal库API从HTML5文档中提取数据并将其保存到XML?有没有其他可能的替代方案?

此外,我正在尝试使用Java解析HTML5文档,并将其存储在可扩展标记语言中。有没有什么好的解决方案可以只找到特定的标签并从中生成XML?

请务必让我知道。谢谢。

EN

回答 1

Stack Overflow用户

发布于 2011-10-06 04:13:51

市面上有许多Java HTML解析器,但我建议您使用validator.nu提供的HTML5解析器,可以从这里下载:http://about.validator.nu/htmlparser/

HTML5的主要参与者之一Mozilla的Henri Sivonen编写了使用HTML5解析器算法的代码,您将找不到比这更可靠的解析器了,它创建了一个真正的DOM,可以使用标准的XML进行操作,并使用XPath查询超链接。有一些示例说明了如何对其使用XSLT转换,以及如何获得创建的DOM的XML序列化。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7666510

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档