我写了一个从网站上提取信息的java代码。有一个表只有在被点击时才会触发(片段?我是HTML的新手)。我试着通过网站的HTML来查找id,但是没有找到。就像我说的,它只在点击时才会出现在HTML上。我在考虑保持URL连接打开足够长的时间来触发元素,然后提取信息。我该怎么做呢?
到目前为止,我的程序在链接之前提取页面上给出的信息。
发布于 2015-05-22 21:56:48
我的第一印象是该网站使用javascript来加载特定的表。很可能,HTML解析器不会在页面上执行javascript,因此您将无法获得任何动态内容。在java中执行javascript可能很棘手,但有几个路径可以开始,请参见:
Parsing web page containing dynamic javascript objects
另一种方法是手动分析页面,找出特定的js代码的作用,并尝试将其复制到java代码中。
https://stackoverflow.com/questions/30398409
复制相似问题