我试图从一个需要登录的网站上抓取,我已经做到了这一点,并成功地抓取了网站。
我遇到的问题是,我试图抓取的值直到网站加载几秒钟后才出现,我是从西门子OZW772.04控制器单元中抓取的,它必须获取摄氏度,并且需要几秒钟才能加载完它们。
所以,在我抓取网站后,文本是正确的,但是所有的值都是这样的
Datapoint Value
HN1 heat-in \n
---
\n \n
\n
HN2 room-temp \n
---
\n \n
\n 其中\n是我需要的值。我已经尝试过让线程等待,但似乎也不起作用。
发布于 2012-09-12 23:58:47
如果网页使用javascript加载或编辑html,那么您将看不到这一点,除非您以浏览器的方式呈现页面(即,使用浏览器)。您可以使用WebKit and the WebKit.NET library或one of several alternatives。
https://stackoverflow.com/questions/12392031
复制相似问题