我正在使用Jsoup解析包含子字符串的字符串,该字符串以<开头,后面跟着一个单词来获取文本,但没有正确地获取文本。
String input ="<p>testing with less than <string</p>";
String s = Jsoup.parse(input).text();在提取属性文本之后,“测试小于”是结果,而不是小于的测试
发布于 2019-05-27 10:27:15
String input = "<p>testing with less than <string</p>";
System.out.println(input);输出:
<p>testing with less than <string</p>如果我们打印输入,我们将得到整个字符串,如图所示。
String s1 = Jsoup.parse(input).text();
System.out.println(s1);// when we use method text()输出:
testing with less than 如果我们使用j汤text()方法,就会得到没有HTML标记的纯文本。
但是,由于char "<“,我们仍然没有获得整个输入字符串。
这个理由在下面的例子中是有道理的。
String s2 = Jsoup.parse(input).html();
System.out.println(s2);// when we use method html()输出:
<html>
<head></head>
<body>
<p>testing with less than
<string></string> //the end tag is auto generated by the method
</p>
</body>
</html>如果我们使用jsoup ()方法,就会得到整个格式化的HTML代码。
在这里,我们可以清楚地看到,在另一个HTML标记之间的字符"<“之后写的单词会自动转换为HTML标记。(如果我们只编写一个开始标记,那么结束标记就会自动创建,不管它是否有效)
正如第一个例子所示,这就是我们没有获得全部输入的原因。
https://stackoverflow.com/questions/56116571
复制相似问题