我是编程新手,我已经翻阅过Jsoup.org食谱和堆栈溢出了一遍又一遍,但我的应用程序就是不能工作。当我试图解析来自网站的文本时,应用程序崩溃。我真的不知道我在哪里弄错了。
我想从html获取以下文本:
<div id="noga">
<div>
<h1>Kontakt</h1>
Agencija RS za okolje<br />
Vojkova 1b<br />
1000 Ljubljana, Slovenija<br />
Tel: +386 (0)1 4784 000<br />
Fax: +386 (0)1 4784 052<br />
<a href="mailto:gp.arso@gov.si">gp.arso@gov.si</a>
</div>我在eclipse中的代码是:
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Gumbi2{
public static void main(String args[]) throws IOException {
Document doc = Jsoup.connect("http://www.arso.gov.si/vreme/napovedi%20in%20podatki/bio.html").get();
Elements divs = doc.select("div#noga");
for (Element div : divs)
System.out.println(div.text());
}
}谁能帮帮我,给我指个正确的方向?
谢谢你!!
发布于 2012-02-28 21:59:55
你已经很接近了。因为noga是一个id,所以您可以直接使用它,而无需指定div。
Document doc = Jsoup.connect("http://www.arso.gov.si/vreme/napovedi%20in%20podatki/bio.html").get();
Element nogadiv = doc.getElementById("noga").child(0);
System.out.println(nogadiv);因为您需要联系信息,所以只需获取noga的第一个子项。
发布于 2012-02-28 19:40:02
你没有关闭noga div。
https://stackoverflow.com/questions/9479195
复制相似问题