首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >转到DataFrame后网络抓取不完整

转到DataFrame后网络抓取不完整
EN

Stack Overflow用户
提问于 2020-06-13 23:53:51
回答 1查看 27关注 0票数 1

我正在从这个网站的https://www.iban.com/country-codes表中进行网络抓取,但是当把它放到DataFrame中时,抓取的信息是不完整的。

代码语言:javascript
复制
# Webscrape list of official countries with country codes
url = 'https://www.iban.com/country-codes'
response = requests.get(url) 
page = response.content
scraping = BeautifulSoup(page, "lxml") 
scraping
element = scraping.find("table", attrs={"class" : "table table-bordered downloads tablesorter"})
df = pd.read_html(str(element))
countrycodes = df[0]

因此,例如:菲律宾( the )、大不列颠及北爱尔兰联合王国(the)、瑞士等国家不在数据框架中。

EN

回答 1

Stack Overflow用户

发布于 2020-06-14 00:41:44

数据在DataFrame中。当您将countrycodes打印到屏幕上时,pandas将缩短数据帧并放置...而不是行。

为了演示,此代码将加载表并将其保存到CSV:

代码语言:javascript
复制
import pandas as pd

df = pd.read_html('https://www.iban.com/country-codes')[0]
df.to_csv('data.csv')

生成此CSV (突出显示的是"Philippines (the)"):

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62362253

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档