我上几天问了一个问题,得到了公认的答复。问题是,
但是,问题是,当我想将这段代码应用到一个大型数据文件时,它会给我一个ValueError: cannot handle a non-unique multi-index!错误。我尝试通过df.columns.value_counts()检查我的数据帧的索引,如下所示,我的数据帧的所有计数都是1。我的dataframe有30列,有3000行。point_id、date和是列。

有人知道如何解决这个问题吗?非常感谢。
发布于 2022-03-24 15:10:02
您有254行,其中至少有两个相同的数据点(point_id,日期)。您想对相同的记录(point_id,日期)做什么?例如,您可以对这些数据进行分组并保持平均值。
以下是清单:
df = pd.read_csv('dft.csv', index_col=0)
counts = df.value_counts(['point_id', 'date'], sort=False).loc[lambda x: x > 1]https://stackoverflow.com/questions/71604334
复制相似问题