我试着创建一个小的自动测试脚本。我需要找到和打印所有的输入从一个网页。我正在尝试使用mechanize库。
我写了这个剧本:
import urllib
import cookielib
import mechanize
url = "https://www.sito.com/page.html"
cookie = cookielib.CookieJar()
browser = mechanize.Browser()
browser.set_cookiejar(cookie)
browser.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
browser.open(url)
for f in browser.forms():
print f.name如何使用mechanize或其他库打印来自网页的所有输入?
发布于 2013-09-05 20:49:45
你为什么不直接用urllib2 + BeautifulSoup
import urllib2
from bs4 import BeautifulSoup
url = "http://sito.com/SitoContact.htm" # change to whatever your url is
page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)
for i in soup.find_all('input'):
print iFYI,由于ssl错误,我无法访问您提供的页面,这就是为什么该示例使用另一个URL的原因。
注意,如果您需要填写表单或使用输入进行一些操作,则需要mechanize或类似的工具。但是,无论如何,您可以继续使用BeautifulSoup来解析html。另外,看一看硒项目。
https://stackoverflow.com/questions/18645593
复制相似问题