首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >处理itextsharp XMLWorkerHelper.ParseXHTML严格行为

处理itextsharp XMLWorkerHelper.ParseXHTML严格行为
EN

Stack Overflow用户
提问于 2012-03-24 13:21:29
回答 1查看 3K关注 0票数 0

在尝试使用XMLWorkerHelper.GetInstance().ParseXHTML()时,我发现它真的很严格。任何错误的标签顺序或未关闭的标签都会导致抛出异常。

我正在转换我无法控制的HTML。

有没有什么标志可以让它不那么严格?一个输入回调接口来处理有趣的标记?在itextsharp.tools.xml.html有什么发现吗?或者是一个与itextsharp.text.IElement兼容的全新的库?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-03-26 21:22:13

整个流水线都是基于这样的假设:传入一个有效的XML文档,其他的都会抛出异常。您可以自定义管道,并为链接解析、自定义CSS属性和新的HTML标记添加自己的处理程序,但核心文档处理器仍然需要有效的HTML。

我建议你调查一下running your HTML through a library that can convert it to XHTML

编辑

也可以查看wkhtmltopdf。它使用webkit来呈现HTML,并且(显然)做得很好。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9849370

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档