我正在尝试只获取团队名称,并删除在我抓取表时附加的团队记录。我知道我可以使用rstrip(),但我不想输入要删除的所有团队记录。有什么想法吗?
# Using Pandas to extract rankings tables
import pandas as pd
tables = pd.read_html(base_site)
# base_site = "http://cbssports.com/college-football/rankings/cbs-sports-ranking/"
rankings=tables[0]
rankings
rankings.drop(['Trend', 'Next Game', 'Unnamed: 5', 'Unnamed: 3'], axis=1)由此我得到如下结论:
Rank Team
0 1 LSU 15-0
1 2 Clemson 14-1
2 3 Ohio St. 13-1
3 4 Georgia 12-2
4 5 Oregon 12-2
... ... ...
125 126 New Mexico St. 2-10
126 127 Old Dominion 1-11
127 128 UTEP 1-11
128 129 Massachusetts 1-11
129 130 Akron 0-12130行×2列
希望从团队列中删除团队的记录。有什么想法?
发布于 2020-07-09 09:06:11
你可以做rsplit
df['Team']=df['Team'].str.rsplit(' ', n=1).str[0]https://stackoverflow.com/questions/62805527
复制相似问题