首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用pandas.crosstab保持序

用pandas.crosstab保持序
EN

Stack Overflow用户
提问于 2022-08-02 15:15:15
回答 1查看 30关注 0票数 1

我有以下csv数据:

代码语言:javascript
复制
question,answer
m2020_s,3
m2020_s,3
m2020_s,3
m2020_s,3
m2020_s,3
m2020_s,3
a2020_k,1
a2020_k,2
a2020_k,1
a2020_k,4
a2020_k,1
a2020_k,1
d2015_a,5
d2015_a,4
d2015_a,4
d2015_a,4
d2015_a,4
d2015_a,4

我使用pd.crosstab来计算每个答案被给出的次数,但是这个函数扰乱了我的数据的顺序。这是我的代码:

代码语言:javascript
复制
import pandas as pd

df = pd.read_csv('example.csv')

output_array = pd.crosstab(df['question'], df['answer']).to_numpy()

print(output_array)

预期结果:

代码语言:javascript
复制
[[0 0 6 0 0]
 [4 1 0 1 0]
 [0 0 0 5 1]]

实际结果:

代码语言:javascript
复制
[[4 1 0 1 0]
 [0 0 0 5 1]
 [0 0 6 0 0]]

为什么会发生这种情况?我怎样才能保存数据的顺序?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-08-02 15:21:15

你能试试这个吗

代码语言:javascript
复制
pd.crosstab(df['question'], df['answer']).reindex(df['question'].unique()).to_numpy()

O/P:

代码语言:javascript
复制
array([[0, 0, 6, 0, 0],
       [4, 1, 0, 1, 0],
       [0, 0, 0, 5, 1]], dtype=int64)

说明:根据数据集中的唯一元素重新排序索引,基于第一次出现。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73209917

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档