首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何向JTidy添加新标签?

如何向JTidy添加新标签?
EN

Stack Overflow用户
提问于 2012-01-24 02:25:14
回答 2查看 1.3K关注 0票数 4

我正在尝试使用jTidy从(现实世界)HTML.But jTidy不解析自定义标签中提取数据。

代码语言:javascript
复制
<html>
  <body>
    <myCustomTag>some text</myCustomTag>
    <anotherCustom>more text</anotherCustom>
  </body>
</html>

我不能在自定义标记之间获取文本,我必须使用jTidy,因为我将使用xpath。

我尝试过HTMLCleaner,但它不支持完整的xpath函数。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-09-09 16:14:45

还可以使用Java properties对象设置属性,例如:

代码语言:javascript
复制
import java.util.Properties;
Properties oProps = new Properties();
oProps.setProperty("new-blocklevel-tags", "header hgroup article footer nav");

Tidy tidy = new Tidy();
tidy.setConfigurationFromProps(oProps);

这将使您不必创建和加载配置文件。

票数 4
EN

Stack Overflow用户

发布于 2012-03-17 04:41:23

查看http://tidy.sourceforge.net/docs/quickref.html#new-blocklevel-tags

最简单的方法是创建一个文件,我将我的文件命名为jTidyTags,并调用:

代码语言:javascript
复制
Tidy tidy = new Tidy();
tidy.setConfigurationFromFile("jTidyTags");

在那之后,它会抛出一条警告,说它不符合W3C,但谁在乎呢。这将允许您解析该文件。

为您提供的jTidyTags示例如下:

代码语言:javascript
复制
new-blocklevel-tags: myCustomTag anotherCustom

希望这能有所帮助!

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8976637

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档