首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python Pandas Dataframe Melt

Python Pandas Dataframe Melt
EN

Stack Overflow用户
提问于 2018-02-06 12:33:09
回答 3查看 204关注 0票数 2

我有一个数据框架:

代码语言:javascript
复制
custid   day  freq
346782   1     0
346782   0     1
346782   1     2
346783   0     0
346783   0     1
346783   0     2

但出于机器学习的目的,我想将其半转置为:

代码语言:javascript
复制
346782 1 0 0 1 1 2 
346783 0 0 0 1 0 2

你知道,这样custID只出现一次,所有相关的特性都在它前面的一行中。

我尝试过各种方法,例如:

代码语言:javascript
复制
df1 = pd.melt(newdf, id_vars=['0']).drop('variable', axis=1).sort_values(0)

我怎样才能完成这个转换呢?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2018-02-06 12:42:10

我在这里用的是stack,你也可以试试melt

代码语言:javascript
复制
s=df.set_index('custid').stack()

s.index=pd.MultiIndex.from_arrays([s.index.get_level_values(level=0),s.groupby(level=0).cumcount()])
s.unstack()
Out[843]: 
        0  1  2  3  4  5
custid                  
346782  1  0  0  1  1  2
346783  0  0  0  1  0  2
票数 3
EN

Stack Overflow用户

发布于 2018-02-06 13:13:14

您也可以尝试使用numpy.ravel

代码语言:javascript
复制
df.groupby("custid").apply(lambda x: x[["day", "freq"]].values.ravel())
custid
346782    [1, 0, 0, 1, 1, 2]
346783    [0, 0, 0, 1, 0, 2]
dtype: object

pd.DataFrame(
  df.groupby("custid").apply(lambda x: x[["day", "freq"]].values.ravel()).to_dict()
).T

        0   1   2   3   4   5
346782  1   0   0   1   1   2
346783  0   0   0   1   0   2
票数 0
EN

Stack Overflow用户

发布于 2018-02-06 13:22:13

使用

代码语言:javascript
复制
In [192]: pd.DataFrame.from_dict(
            {k: x[['day', 'freq']].values.flatten() for k, x in df.groupby('custid')}, 
            orient='index')
Out[192]:
        0  1  2  3  4  5
346782  1  0  0  1  1  2
346783  0  0  0  1  0  2
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48635520

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档