我正在尝试抓取这个静态页面上的表:
http://www.asx.com.au/prices/targetratetracker.htm
使用一个基于简单UI的scraper here进行测试,您可以看到,即使使用KeepEverythingExtractor设置,它也不会返回表。
使用targetratetracker.htm页面上的Inspector,我们可以看到以下内容:
A Parser-blocking, cross-origin script, http://www.adobetag.com/d4/v2/.../amc.js, is invoked via document.write.我不知道应该使用哪种库或语言,只想知道是否有办法绕过拦截器(如果这确实是问题所在)。
发布于 2017-01-12 16:30:36
这个页面使用框架,这意味着该页面包含另一个页面,

网址是:http://www.asx.com.au/data/trt/TargetRateTracker.htm
https://stackoverflow.com/questions/41608101
复制相似问题