在这特定页面(或任何“匹配”页面)上,您可以选择用于查看匹配的单个统计信息的名称。我如何抓取“杀死”属性,例如使用网络抓取?
在我使用的大多数教程中,use抓取似乎很简单。但是,当检查此站点,特别是“杀死”项时,您会看到以下内容
(问题1.)什么是“数据-v-71c3e2a1”?在我的html、css或网页抓取教程中,我从来没有见过这样的东西。它出现在不同的变体各地的网站。
(问题2.)更重要的是,如何获取本节中的杀人数量?我尝试过使用scrapy和xpath抓取:
刮削壳response.xpath("//*@id="app"/div3/div2/div/main/div3/div2/div2/div6/div2/div3/div2/div1/div/div1/span2").get() https://cod.tracker.gg/warzone/match/1424533688251708994?handle=PatrickPM
但这会引发语法错误。
response.xpath("//*@id="app“SyntaxError):无效语法
response.css("").get()的抓取也很困难。我应该用硒吗?或者只是普通的请求/bs4 4?我什么都抓不到。
谢谢。
发布于 2020-10-25 20:44:10
这会返回您需要的数据吗?
import requests
endpoint = "https://api.tracker.gg/api/v1/warzone/matches/1424533688251708994"
r = requests.get(endpoint, params={"handle": "PatrickPM"})
data = r.json()["data"]无论如何,如果有可用的API,我建议使用API。它比使用BeautifulSoup或selenium容易得多。
https://stackoverflow.com/questions/64528506
复制相似问题