首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Mars 2020 Web抓取

Mars 2020 Web抓取
EN

Stack Overflow用户
提问于 2021-04-25 05:55:14
回答 1查看 67关注 0票数 3

我正在尝试从“坚持不懈的火星天气报告”(https://mars.nasa.gov/mars2020/weather/)中获取数据。但是,当我尝试抓取时,例如,火星日期,它返回一个列表中的无项。如下所示:

代码语言:javascript
复制
import requests
from bs4 import BeautifulSoup as soup

html = requests.get('https://mars.nasa.gov/mars2020/weather/')
html.status_code

marsDat= []

for date in bsobj.findAll('span', {'class':'marsDate'}):
    marsDat.append(date.text.strip())
    
print(marsDat)
#returns: ['']

有人能给我点提示吗?这是因为我们不能在这个网站上做网络抓取吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-04-25 06:04:26

您看到的数据是从外部URL加载的。要打印当前的Mars日期,您可以执行以下操作:

代码语言:javascript
复制
import json
import requests

url = "https://mars.nasa.gov/rss/api/?feed=weather&category=mars2020&feedtype=json"
data = requests.get(url).json()

# uncomment to print all data:
# print(json.dumps(data, indent=4))

max_sol = max(data["sols"], key=lambda k: int(k["sol"]))
print(max_sol["sol"])

打印:

代码语言:javascript
复制
62
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67247795

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档