我希望检索一个网站的来源,这是动态生成的点击一个链接。链接本身如下:
<a onclick="function(); return false" href="#">Link</a>这使我无法直接查询URL,从而获得动态生成的网站(urllib/2)。
如何检索通过python使用上述函数( HTML)生成的网站源?有没有绕过return false" href="#"的方法?或者是完整的onclick,并得到实际的URL?
如果有另一种方法从上面的抽象链接生成网站,以便从python中的urllib获得它,请参考它。
编辑:
我概括了上面看到的代码,但是有人告诉我,为了能够使用它,必须逆向工程特定的javascript。
链接到.js - http://a.quizlet.com/j/english/create_setku80j8.js
链接到具有链接的站点:
<a onclick="importText(); return false" href="#">Bulk-import data</a>网站的实际网址:http://quizlet.com/create_set/
相关.js的美化JS:http://pastie.org/737042
发布于 2009-12-10 13:24:41
在该脚本中,我没有立即看到任何内容生成或链接跟踪代码;importText所做的只是切换是否显示了几个div。
如果您想研究webapp为执行特定操作而进行的调用,为了从bot中复制它们,最好是查看浏览器在执行该操作时发出的HTTP请求(表单提交和AJAX调用)。您可以使用Firebug的“Net”面板来研究Firefox,也可以使用Fiddler来研究IE。
发布于 2009-12-10 09:49:54
您可能需要反向工程的JavaScript,以了解是怎么回事。
你能提供有关的网站和链接吗?
https://stackoverflow.com/questions/1879876
复制相似问题