首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >打印来自网页的所有输入

打印来自网页的所有输入
EN

Stack Overflow用户
提问于 2013-09-05 20:42:59
回答 1查看 222关注 0票数 1

我试着创建一个小的自动测试脚本。我需要找到和打印所有的输入从一个网页。我正在尝试使用mechanize库。

我写了这个剧本:

代码语言:javascript
复制
import urllib  
import cookielib  
import mechanize  

url = "https://www.sito.com/page.html"  

cookie = cookielib.CookieJar()  
browser = mechanize.Browser()  

browser.set_cookiejar(cookie)  
browser.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)  

browser.open(url)  

for f  in browser.forms():  
    print f.name

如何使用mechanize或其他库打印来自网页的所有输入?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-09-05 20:49:45

你为什么不直接用urllib2 + BeautifulSoup

代码语言:javascript
复制
import urllib2
from bs4 import BeautifulSoup

url = "http://sito.com/SitoContact.htm"  # change to whatever your url is

page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)

for i in soup.find_all('input'):
    print i

FYI,由于ssl错误,我无法访问您提供的页面,这就是为什么该示例使用另一个URL的原因。

注意,如果您需要填写表单或使用输入进行一些操作,则需要mechanize或类似的工具。但是,无论如何,您可以继续使用BeautifulSoup来解析html。另外,看一看项目。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18645593

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档