我目前正在写一个爬虫脚本与python.I。我知道美丽的汤包,并已做了一些简单的crawlers.currently写一个网站的爬虫有四个下拉菜单,选择后,如果我按下下载按钮,一个pdf将被下载。
post_data = {
'select name 1' : 'value 1',
'select name 2' : 'value 2',
'select name 3' : 'value 3',
'select name 4' : 'value 4',
}
r = requests.post("http://mydemosite.aspx",data=post_data)这是不工作的。我想使用Beautifulsoup来选择四个下拉菜单,并使一个虚拟的表单提交,并获得适当的pdf.Is它有可能获得这个(提交一个表单)与美丽的汤。
发布于 2016-09-25 22:45:19
一般来说,是的,这是可能的,但这真的取决于目标网站和提交表单所涉及的内容。
如果这是一个常规的超文本标记语言表单,不涉及javascript,你可以使用像RoboBrowser或MechanicalSoup这样的包来简化表单的提交。这些包是基于requests和BeautifulSoup的,如果需要,您还可以访问"soup“对象。
https://stackoverflow.com/questions/39688059
复制相似问题