我有这样一个datatable:
Run, test1, test2
1, 100, 102.
2, 110, 100.
3, 108, 105.我希望这两栏合并如下:
Run, results
1, 100
1, 102
2, 110
2, 100
3, 108
3, 105在潘达斯我该怎么做?非常感谢!
发布于 2017-09-22 13:04:25
用stack结合Multiindex按双reset_index列
df = df.set_index('Run').stack().reset_index(drop=True, level=1).reset_index(name='results')
print (df)
Run results
0 1 100.0
1 1 102.0
2 2 110.0
3 2 100.0
4 3 108.0
5 3 105.0或melt
df = df.melt('Run', value_name='results').drop('variable', axis=1).sort_values('Run')
print (df)
Run results
0 1 100.0
3 1 102.0
1 2 110.0
4 2 100.0
2 3 108.0
5 3 105.0带numpy.repeat的Numpy解
a = np.repeat(df['Run'].values, 2)
b = df[['test1','test2']].values.flatten()
df = pd.DataFrame({'Run':a , 'results': b}, columns=['Run','results'])
print (df)
Run results
0 1 100.0
1 1 102.0
2 2 110.0
3 2 100.0
4 3 108.0
5 3 105.0发布于 2017-09-22 13:55:15
我就是这样实现这一目标的
备选案文1
pd.wide_to_long(df,stubnames='test',i='Run',j='LOL').reset_index().drop('LOL',1)
Out[776]:
Run test
0 1 100.0
1 2 110.0
2 3 108.0
3 1 102.0
4 2 100.0
5 3 105.0注意:在这里,我没有将列名从test更改为结果,我认为使用test作为新的列名在您的情况下更好。
选项2
pd.concat
df=df.set_index('Run')
pd.concat([df[Col] for Col in df.columns],axis=0).reset_index().rename(columns={0:'results'})
Out[786]:
Run results
0 1 100.0
1 2 110.0
2 3 108.0
3 1 102.0
4 2 100.0
5 3 105.0https://stackoverflow.com/questions/46365490
复制相似问题