问BeautifulSoup从谷歌获得“f slp”项目
EN

Stack Overflow用户

提问于 2014-03-14 05:19:11

回答 1查看 411关注 0票数 1

嗨，伙计们，我正试着从谷歌的一些论文中得到引文。这是我的密码

import urllib
import mechanize
from bs4 import BeautifulSoup

import csv
import os #change directory
import re #for regular expressions



br = mechanize.Browser()

br.set_handle_equiv(False)
br.set_handle_robots(False)   # ignore robots

br.addheaders = [('User-agent', 'Firefox')]             # [()]
br.open('http://google.com/')

br.select_form(name='f')   # Note: select the form named 'f' here
term = "Multinational Study of the Efficacy and Safety of Humanized Anti-HER2 Monoclonal Antibody in Women Who Have HER2-Overexpressing Metastatic Breast Cancer That Has Progressed After Chemotherapy for Metastatic Disease".replace(" ","+")
br.form['q'] = term # query
data = br.submit()

soup = BeautifulSoup(data)


cite= soup.findAll('div',{'class': 'f slp'})
ref = str(cite[1])
print ref

不管怎么说，我总是得痔疮。我要这篇论文的引文数量。

python

beautifulsoup

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-03-14 05:34:46

问题是在表单提交后得到的页面上没有引用信息，换句话说，在div类中没有f slp类。

您有几种解决方案：

而不是机械化，而是使用硒在真正的浏览器中实现自动化。
使用google搜索api

另请参阅：

从Python应用程序中的Google搜索
GoogleScraper.py -一个解析google搜索结果的简单python模块。

希望这能有所帮助。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/22396751

复制

相似问题

问BeautifulSoup从谷歌获得“f slp”项目
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问BeautifulSoup从谷歌获得“f slp”项目EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问BeautifulSoup从谷歌获得“f slp”项目
EN