搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

2回答

Google Play scraper

我正在尝试用PHP开发一个Play Store评论采集器，我需要向这个URL https://play.google.com/store/getreviews发出一个POST请求，我看到了带有firebug的post参数。require_once 'goutte.phar'; "id" => "com.trello", "pageNum"

浏览 1修改于2021-04-30得票数 1

3回答

Python Scraper for Javascript？

有没有人可以给我一个好的Python屏幕抓取javascript代码的库(希望有好的文档/教程)？我很想看看有哪些选择，但最容易学的是最快的结果……不知道有没有人有经验。我听说过一些关于蜘蛛猴的事情，但也许还有更好的？<a href="javascript:openFindItem(12510109)" onclick="s_objectID="javascrip

浏览 0提问于2010-05-28得票数 1

回答已采纳

1回答

使用并在代理它时遇到一些问题。它在本地运行得很好，没有任何问题，但在生产环境中，我总是被重定向到登录页面。想让它通过proxy运行，我该怎么做呢？Net::HTTP.get(URI.parse('http://www.linkedin.com/in/SOMETHING'))=> "<html><head>\n<script type=\"text/javascript\">\nwindow.onload = function() {\n var domain

浏览 2修改于2014-04-12得票数 0

2回答

Instagram Story Scraper

我做了一个小的Instagram故事刮板，但我不能让它工作…我可能只是太累了。我已经试过所有的方法了，但我自己解决不了这个问题这是我的index.php文件require_once('instagramStory.php');echo $story->getStory("garyvee");这是instagramStory.phpclass instagram_story{

浏览 30提问于2020-02-04得票数 2

回答已采纳

1回答

足球统计Python Scraper

我希望将一些收集到CSV中，然后使用R可视化该数据。

浏览 1提问于2012-12-06得票数 1

回答已采纳

1回答

Java - Web Scraper问题

我正在尝试刮这个页面的，但我需要网格，当你点击‘投注视图’时显示…我遇到了一些麻烦。我所拥有的代码有可能实现吗？当我打印div时，我得到的结果是null。 final WebClient webClient = new WebCl

浏览 13修改于2021-02-08得票数 1

回答已采纳

1回答

Linkedin scraper提取技能

我试图从人们的公共档案中获取某些角色最常用的技能。我可以提取电子邮件，公司，姓名，职位等，但我不能获得技能。我使用的是parsel中的Selector。我尝试了许多方法，但显然我的目标是错误的类，我可能应该遍历技能。到目前为止，我的代码如下： sleep(5)

浏览 9提问于2020-05-26得票数 0

1回答

scraper无法切换输入

我正在尝试使用我编写的selenium脚本登录一个网站。im的问题是，当它登录时，它无法找到输入的密码。 search = driver.find_element_by_id("clareity")search.find_element_by_xpath('//div[@class="form-control lock"]') search.send_keys("pass") 在查找xpath时，它会将密钥发送到用户名输入中，因此当发送两个密钥时，在站点上的用户

浏览 21提问于2021-05-05得票数 0

回答已采纳

1回答

Beautifulsoup web scraper问题

我正在使用BeautifulSoup和mechanise从网页中查找一些内容。问题是，有时我要找的字符串找不到。我不知道有什么问题问题出在data.find(text=re.compile('string to find'))上。网页总是在下载，但有时找不到字符串。我想问题可能出在加载页面的错误HTML格式上。有什么想法吗？from BeautifulSoup import BeautifulSoup as soup from

浏览 0修改于2018-03-17得票数 1

2回答

Scraper App Engine for Steam

因此，目前基本上，我们正在尝试编写一个基本的HTML5页面，当您按下一个按钮时，它会返回Steam上的用户是在游戏中、离线还是在线。我们已经查看了Steam API，为了找到这些信息，它需要用户的64位ID (steamID64)，而我们在网站上只获得了用户名。为了找到他们的64位id，我们试图从一个网站(steamidconverter.com)上抓取用户的64位id。我们尝试通过javascript来实现这一点，但我们当然遇到了跨域块，不允许我们从google App Engine网站访问这些数据。我有使用Python语言的经验，所以我尝试用Python语言从那个网站(以steamidc

浏览 1修改于2012-07-06得票数 0

1回答

Twitter Scraper速率限制

我试图抓取所有的“以下”帐户信息(用户名，网站，最后的推文日期)的某个帐户。例如https://www.twitter.com/verified/following。正如你可能看到的，它有365.7K以下的用户名。我抓取了用户名，现在我必须转到所有链接并抓取数据。代码运行良好，它获得了所需的所有信息，但在链接访问达到一定数量后，Twitter表示我超过了速率限制，并停止显示有关我访问的帐户的任何信息。 def get_user_info(user): """Gets User Info - Username, Website, Last Tweet Date

浏览 13修改于2020-10-24得票数 1

3回答

Python Web Scraper + Cleanup

所以我现在正在尝试导出一个twitter的.html页面，并且我使用BeautifulSoup创建了这个网页爬行器。OUTPUT.csv文件目前非常混乱，我的问题如下(当前的.py文件如下所示)："<div class=

浏览 3修改于2017-12-06得票数 0

2回答

使用Web::Scraper提取javascript

我在使用Web::Scraper提取javascript时遇到了问题。下面是我的测试脚本：use Modern::Perl;use Data::Dumper; my $scraper = scraper { process "//script", "scripts[]&q

浏览 1提问于2013-05-22得票数 1

1回答

TDD for IMDB html scraper

我目前正在开发一个TDD idmb html刮刀，这将从imdb网页提取某些领域。例如：C++中的标题、概要、演员等。解析器类有一个loadfile函数，它将文件加载到一个字符串中，然后开始调用各种matchpatttern函数，比如MatchPattern::extractTitle(string filecontents)，并将它们存储在解析器的私有变量中。 matchpattern本质上是一个具有静态函数的实用程序类。测试matchpattern类没有问题。但是解析器类呢？我应该如何为TDD设计它。我

浏览 0提问于2009-07-16得票数 0

回答已采纳

1回答

PHP: imdb scraper海报

我有一个来自另一个网站的iMDb-Scraper。它运行得很好，现在iMDb改变了它的html输出，正则表达式找不到海报了。

浏览 0提问于2013-04-06得票数 0

1回答

Python Scraper文件命名

__init__() #resets the parser/scraper for serial parsing/scraping print("Done!")

浏览 0提问于2016-11-07得票数 0

1回答

Iron Web Scraper登录

在抓取网站之前，我已经阅读了登录网站的教程，但它就是不起作用。我构造了一个HttpIdentity对象，将其添加到Identities集合中，并处理了请求，但是返回到scrape的页面仍然是登录页面。在他们的网站和文档中没有太多关于这方面的内容。下面是我的代码： var identity = new HttpIdentity UseCookies = true, NetworkPassword = _password

浏览 14提问于2019-04-11得票数 0

3回答

Web::Scraper和Perl

my $tweets = scraper { my $secondLevel = scraper

浏览 1修改于2015-12-16得票数 0

1回答

amazon_scraper安装问题

这是我试图下载刮板的链接：pip install amazon_scraper Complete output from command python setup.py egg_infostring>", line 20, in <module> File "

浏览 4修改于2015-10-28得票数 1

1回答

如何使用scraper扩展文本

我需要创建一个Java应用程序(部分创建)，它需要像这样删除tripadvisor网页上的所有评论：<span class="taLnk hvrIE6 tr162902990 moreLink ulBlueLinks" onclick="ta.util.cookie.setPIDCookie(2247);ta.call('ta.servlet.Reviews.expandReviews',e

浏览 2提问于2014-10-02得票数 1

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Google Play scraper

Python Scraper for Javascript？

代理LinkedIn Scraper

Instagram Story Scraper

足球统计Python Scraper

Java - Web Scraper问题

Linkedin scraper提取技能

scraper无法切换输入

Beautifulsoup web scraper问题

Scraper App Engine for Steam

Twitter Scraper速率限制

Python Web Scraper + Cleanup

使用Web::Scraper提取javascript

TDD for IMDB html scraper

PHP: imdb scraper海报

Python Scraper文件命名

Iron Web Scraper登录

Web::Scraper和Perl

amazon_scraper安装问题

如何使用scraper扩展文本

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐