首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >网络抓取表

网络抓取表
EN

Stack Overflow用户
提问于 2021-10-06 14:09:39
回答 2查看 36关注 0票数 0

我一直在拉年度收入表,而我本应该每季度拉一次。有人能解释一下我做错了什么吗?(代码如下)

代码语言:javascript
复制
url='https://www.macrotrends.net/stocks/charts/TSLA/tesla/revenue'

html_data=requests.get(url).text

soup=BeautifulSoup(html_data, 'html.parser')

tesla_revenue=pd.DataFrame(columns=['Date', 'Revenue'])
for row in soup.find('tbody').find_all('tr'):
    col=row.find_all('td')
    date=col[0]
    revenue=col[1]
    tesla_revenue=tesla_revenue.append({'Date':date,'Revenue':revenue}, ignore_index=True)

tesla_revenue.head()
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-10-06 14:22:50

季度数据位于第二个表([1])中:

代码语言:javascript
复制
url = "https://www.macrotrends.net/stocks/charts/TSLA/tesla/revenue"

html_data = requests.get(url).text

soup = BeautifulSoup(html_data, "html.parser")

table = soup.select("table")[1]

all_data = []
for row in table.find("tbody").find_all("tr"):
    col = row.find_all("td")
    date = col[0].text
    revenue = col[1].text
    all_data.append({"Date": date, "Revenue": revenue})

tesla_revenue = pd.DataFrame(all_data)
print(tesla_revenue.head())

打印:

代码语言:javascript
复制
         Date  Revenue
0  2021-06-30  $11,958
1  2021-03-31  $10,389
2  2020-12-31  $10,744
3  2020-09-30   $8,771
4  2020-06-30   $6,036
票数 1
EN

Stack Overflow用户

发布于 2021-10-06 14:19:05

我认为你应该提取文本。您在代码中编写的代码如下所示。

代码语言:javascript
复制
date=col[0]
revenue=col[1]

你应该像下面这样修改它。

代码语言:javascript
复制
date=col[0].text.strip()
revenue=col[1].text.strip()
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69467341

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档