维基百科的这张表格显示了10大票房收入。我似乎无法得到“worldwide_gross”专栏的总数。有人能帮忙吗?谢谢。
import pandas as pd
boxoffice_df=pd.read_html('https://en.wikipedia.org/wiki/List_of_highest-grossing_films')
films = boxoffice_df[1]
films.rename(columns = {'Worldwide gross(2020 $)':'worldwide_gross'}, inplace = True)
films.worldwide_gross.sum(axis=0)

这是我在计算全球总收入时得到的产出:

发布于 2021-05-04 11:55:47
您必须使用worldwide_gross只保留regex列中的数字,然后使用series.astype('float')将该列转换为浮动。
添加:
films.worldwide_gross = films.worldwide_gross.str.replace('\D',"",regex = True).astype(float)完整守则:
import pandas as pd
boxoffice_df=pd.read_html('https://en.wikipedia.org/wiki/List_of_highest-grossing_films')
films = boxoffice_df[1]
films.rename(columns = {'Worldwide gross(2020 $)':'worldwide_gross'}, inplace = True)
films.worldwide_gross = films.worldwide_gross.str.replace('\D',"",regex = True).astype(float)
films.worldwide_gross.sum(axis=0)发布于 2021-05-04 11:38:39
films.astype({"worldwide_gross": int})
Total =films['worldwide_gross'].sum()发布于 2021-05-04 11:40:16
Total =films['worldwide_gross'].astype('Int32').sum()或者转换数据类型第一。
films = films.convert_dtypes()
Total = films['worldwide_gross'].sum()https://stackoverflow.com/questions/67383961
复制相似问题