文章/答案/技术大牛

发布

社区首页 >问答首页 >ajax页面的无浏览器web抓取

问ajax页面的无浏览器web抓取
EN

Stack Overflow用户

提问于 2013-03-16 20:08:10

回答 1查看 2.4K关注 0票数 0

在阅读了一些web抓取教程后，我尝试过使用Selenium。

其目的是web/屏幕抓取在Ajax调用之后加载所需数据的页面，当(此ajax调用是在初始页面加载之后进行的)..

第二个目标是在后台运行Selenium代码(不打开任何浏览器)，以允许加载页面(包括Ajax调用)、检索最终的HTML并在本地执行所需的处理。

到目前为止的代码如下(来自http://www.geekonweb.com/net/web-page-scraping-using-selenium-and-net/的代码教程)

public ActionResult Index()
    {
        //--
        //Below path should contain IEDriverServer.exe
        var chrome = new ChromeDriver(@"file path");
        chrome.Url = @"<url>";

        chrome.Navigate();

        //extract the html
        //var retval = ie.ExecuteScript("return document.body.outerHTML");

        string result = chrome.PageSource;


        return View();
    }

目前还没有找到一种静默运行Selenium的方法(没有GUI)。如果可以做到这一点，请提供帮助。

其次，请告诉Selenium如何等待Ajax调用完成，然后检索数据。

致以敬意，

selenium

web-scraping

ajax

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-03-16 20:28:02

这里有一个关于how to wait until an element is present的问题。这样做是为了等待AJAX。

这里有一个关于是否可以run selenium headless的问题。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/15449066

复制

相似问题

问ajax页面的无浏览器web抓取
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问ajax页面的无浏览器web抓取EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问ajax页面的无浏览器web抓取
EN