首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >问题:用<后跟word解析字符串

问题:用<后跟word解析字符串
EN

Stack Overflow用户
提问于 2019-05-13 16:39:42
回答 1查看 94关注 0票数 1

我正在使用Jsoup解析包含子字符串的字符串,该字符串以<开头,后面跟着一个单词来获取文本,但没有正确地获取文本。

代码语言:javascript
复制
String input ="<p>testing with less than <string</p>";

String s = Jsoup.parse(input).text();

在提取属性文本之后,“测试小于”是结果,而不是小于的测试

EN

回答 1

Stack Overflow用户

发布于 2019-05-27 10:27:15

代码语言:javascript
复制
String input = "<p>testing with less than <string</p>";
System.out.println(input);

输出:

代码语言:javascript
复制
<p>testing with less than <string</p>

如果我们打印输入,我们将得到整个字符串,如图所示。

代码语言:javascript
复制
String s1 = Jsoup.parse(input).text();
System.out.println(s1);// when we use method text()

输出:

代码语言:javascript
复制
testing with less than 

如果我们使用j汤text()方法,就会得到没有HTML标记的纯文本。

但是,由于char "<“,我们仍然没有获得整个输入字符串。

这个理由在下面的例子中是有道理的。

代码语言:javascript
复制
String s2 = Jsoup.parse(input).html();
System.out.println(s2);// when we use method html()

输出:

代码语言:javascript
复制
 <html>
 <head></head>
 <body>
 <p>testing with less than 
 <string></string> //the end tag is auto generated by the method
 </p>
 </body>
 </html>

如果我们使用jsoup ()方法,就会得到整个格式化的HTML代码。

在这里,我们可以清楚地看到,在另一个HTML标记之间的字符"<“之后写的单词会自动转换为HTML标记。(如果我们只编写一个开始标记,那么结束标记就会自动创建,不管它是否有效)

正如第一个例子所示,这就是我们没有获得全部输入的原因。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56116571

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档