文章/答案/技术大牛

发布

社区首页 >问答首页 >问题:用<后跟word解析字符串

问问题:用<后跟word解析字符串
EN

Stack Overflow用户

提问于 2019-05-13 16:39:42

回答 1查看 94关注 0票数 1

我正在使用Jsoup解析包含子字符串的字符串，该字符串以<开头，后面跟着一个单词来获取文本，但没有正确地获取文本。

String input ="<p>testing with less than <string</p>";

String s = Jsoup.parse(input).text();

在提取属性文本之后，“测试小于”是结果，而不是小于的测试

jsoup

html-parsing

java

回答 1

Stack Overflow用户

发布于 2019-05-27 10:27:15

String input = "<p>testing with less than <string</p>";
System.out.println(input);

输出：

<p>testing with less than <string</p>

如果我们打印输入，我们将得到整个字符串，如图所示。

String s1 = Jsoup.parse(input).text();
System.out.println(s1);// when we use method text()

输出：

testing with less than

如果我们使用j汤text()方法，就会得到没有HTML标记的纯文本。

但是，由于char "<“，我们仍然没有获得整个输入字符串。

这个理由在下面的例子中是有道理的。

String s2 = Jsoup.parse(input).html();
System.out.println(s2);// when we use method html()

输出：

 <html>
 <head></head>
 <body>
 <p>testing with less than 
 <string></string> //the end tag is auto generated by the method
 </p>
 </body>
 </html>

如果我们使用jsoup ()方法，就会得到整个格式化的HTML代码。

在这里，我们可以清楚地看到，在另一个HTML标记之间的字符"<“之后写的单词会自动转换为HTML标记。(如果我们只编写一个开始标记，那么结束标记就会自动创建，不管它是否有效)

正如第一个例子所示，这就是我们没有获得全部输入的原因。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56116571

复制

相似问题

问问题:用<后跟word解析字符串
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问问题:用<后跟word解析字符串EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问问题:用<后跟word解析字符串
EN