首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >BeautifulSoup从谷歌获得“f slp”项目

BeautifulSoup从谷歌获得“f slp”项目
EN

Stack Overflow用户
提问于 2014-03-14 05:19:11
回答 1查看 411关注 0票数 1

嗨,伙计们,我正试着从谷歌的一些论文中得到引文。这是我的密码

代码语言:javascript
复制
import urllib
import mechanize
from bs4 import BeautifulSoup

import csv
import os #change directory
import re #for regular expressions



br = mechanize.Browser()

br.set_handle_equiv(False)
br.set_handle_robots(False)   # ignore robots

br.addheaders = [('User-agent', 'Firefox')]             # [()]
br.open('http://google.com/')

br.select_form(name='f')   # Note: select the form named 'f' here
term = "Multinational Study of the Efficacy and Safety of Humanized Anti-HER2 Monoclonal Antibody in Women Who Have HER2-Overexpressing Metastatic Breast Cancer That Has Progressed After Chemotherapy for Metastatic Disease".replace(" ","+")
br.form['q'] = term # query
data = br.submit()

soup = BeautifulSoup(data)


cite= soup.findAll('div',{'class': 'f slp'})
ref = str(cite[1])
print ref

不管怎么说,我总是得痔疮。我要这篇论文的引文数量。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-03-14 05:34:46

问题是在表单提交后得到的页面上没有引用信息,换句话说,在div类中没有f slp类。

您有几种解决方案:

  • 而不是机械化,而是使用在真正的浏览器中实现自动化。
  • 使用google搜索api

另请参阅:

希望这能有所帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22396751

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档