嗨,所以我现在正在做IMDB电影元数据数据,看起来是这样的。

我需要帮助找到平均imdb评分每年。imdb_score / title_year.
现在,我已经统计了每年的电影数量,并以不到10部电影的数量减少了几年。
我是这样做的
years = df['title_year'].value_counts()
years然后
years2 = years[years >= 10]
years2这导致
2009.0 260
2014.0 252
2006.0 239
2013.0 237
2010.0 230
2015.0 226
2011.0 225
2008.0 225
2012.0 221
2005.0 221
2004.0 214
2002.0 209
2007.0 204
2001.0 188
2000.0 171
2003.0 169
1999.0 168
1998.0 134
1997.0 118
2016.0 106
1996.0 99
1995.0 70
1994.0 54
1993.0 48
1992.0 34
1981.0 33
1989.0 33
1987.0 32
1991.0 31
1988.0 31
1984.0 31
1982.0 30
1990.0 30
1985.0 29
1986.0 26
1980.0 24
1983.0 22
1978.0 16
1977.0 16
1979.0 16
1970.0 12
1971.0 11
1968.0 11
1969.0 10
1964.0 10
1976.0 10
Name: title_year, dtype: int64现在我很困惑,你是如何找到平均imdb评分每年,因为我想绘制一个图表之后。有人能帮我吗?
发布于 2020-04-09 13:32:06
year_avg_score = df.loc[df['title_year'].isin(year2.index)].groupby('title_year')['imdb_score'].mean()一步步地:
df.loc[df['title_year'].isin(year2.index)]只过滤超过10部电影的年份,你已经计算过了。title_year分组并选择imdb_score列。imdb_score平均值。结果的dataframe year_avg_score将以年份作为索引,将平均分数作为列。
https://stackoverflow.com/questions/61122215
复制相似问题