文章/答案/技术大牛

发布

社区首页 >问答首页 >如何使用Python从stat跟踪网站(cod.tracker.gg)中抓取正确的元素

问如何使用Python从stat跟踪网站(cod.tracker.gg)中抓取正确的元素
EN

Stack Overflow用户

提问于 2020-10-25 20:34:18

回答 1查看 1K关注 0票数 2

在这特定页面(或任何“匹配”页面)上，您可以选择用于查看匹配的单个统计信息的名称。我如何抓取“杀死”属性，例如使用网络抓取？

在我使用的大多数教程中，use抓取似乎很简单。但是，当检查此站点，特别是“杀死”项时，您会看到以下内容

(问题1.)什么是“数据-v-71c3e2a1”？在我的html、css或网页抓取教程中，我从来没有见过这样的东西。它出现在不同的变体各地的网站。

(问题2.)更重要的是，如何获取本节中的杀人数量？我尝试过使用scrapy和xpath抓取：

刮削壳response.xpath("//*@id="app"/div3/div2/div/main/div3/div2/div2/div6/div2/div3/div2/div1/div/div1/span2").get() https://cod.tracker.gg/warzone/match/1424533688251708994?handle=PatrickPM

但这会引发语法错误。

response.xpath("//*@id="app“SyntaxError)：无效语法

response.css("").get()的抓取也很困难。我应该用硒吗？或者只是普通的请求/bs4 4？我什么都抓不到。

谢谢。

web-scraping

statistics

python

html

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-10-25 20:44:10

这会返回您需要的数据吗？

import requests


endpoint = "https://api.tracker.gg/api/v1/warzone/matches/1424533688251708994"
r = requests.get(endpoint, params={"handle": "PatrickPM"})
data = r.json()["data"]

无论如何，如果有可用的API，我建议使用API。它比使用BeautifulSoup或selenium容易得多。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/64528506

复制

相似问题

问如何使用Python从stat跟踪网站(cod.tracker.gg)中抓取正确的元素
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用Python从stat跟踪网站(cod.tracker.gg)中抓取正确的元素EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用Python从stat跟踪网站(cod.tracker.gg)中抓取正确的元素
EN