我有一个简单的facebook登录脚本,直到一个月前,它还能完美地工作。但昨天,当我再次尝试运行它时,我得到了这个虚拟页面:
<html xmlns="http://www.w3.org/1999/xhtml">
<head></head>
<body><pre style="word-wrap: break-word; white-space: pre-wrap;">
</pre>
<iframe name="chromedriver dummy frame" src="about:blank"></iframe>
</body>
</html>我猜他们增加了一些新的检测。有没有办法避免这些问题呢?这是我的简化代码:
browser = webdriver.Chrome(executable_path=path, service_args=['--ignore-ssl-errors=true', '--ssl-protocol=TLSv1'])
browser.get("https://www.facebook.com/")
for line in browser.page_source.split('\n'):
print line发布于 2018-06-07 16:34:24
我有一个类似的问题,不是Facebook,而是我们正在开发的页面。
ssl可能是
的问题。(这可能是
--ignore-ssl-... option解决的。)大多数情况下,这是waiting问题。Selenium机器人在服务器打印出它们的上下文之前捕获整个HTML PAGE。因此,可以使用相同的wait options(See this)来解决这个问题
如果有一些unique ID html元素,请插入以下代码:
wait = WebDriverWait(driver, 5)
element = wait.until(EC.visibility_of_element_located((By.ID, 'unique')))https://stackoverflow.com/questions/43045068
复制相似问题