首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >拆分pandas DataFrame中的单元格并计数值

拆分pandas DataFrame中的单元格并计数值
EN

Stack Overflow用户
提问于 2020-01-07 03:16:12
回答 2查看 35关注 0票数 1

我有一个xlsx文件,其中包含按以下问题排序的调查数据:

代码语言:javascript
复制
df = pd.DataFrame({
    'Question 1': ['5-6 hours', '6-7 hours', '9-10 hours'],
    'Question 2': ['Very restful', 'Somewhat restful', 'Somewhat restful'],
    'Question 3': ['[Home (dorm; apartment)]', '[Vehicle;None of the above; Other]', '[Campus;Home (dorm; apartment);Vehicle]'],
    'Question 4': ['[Family;No one; alone]', '[Classmates; students;Family;No one; alone]', '[Family]'],
})

>>> df
Question 1   Question 2        Question 3                               Question 4
5-6 hours    Very restful      [Home (dorm; apartment)]                 [Family;No one; alone]
6-7 hours    Somewhat restful  [Vehicle;None of the above; Other]       [Classmates; students;Family;No one; alone]
9-10 hours   Somewhat restful  [Campus;Home (dorm; apartment);Vehicle]  [Family]  

对于问题3和4,输入是复选框风格,允许多个答案。如何获取特定答案选项的值计数值,而不是整个单元格的值计数值?

e.g

代码语言:javascript
复制
Question 4
Family                    3
No one; alone             2
Classmates; students      1

目前我正在做这件事:

代码语言:javascript
复制
files = os.listdir()
for filename in files:
    if filename.endswith(".xlsx"):
        df = pd.read_excel(filename)
        for column in df:
                x = pd.Series(df[column].values).value_counts()
                print(x)

然而,这并不允许我将具有多个答案的单元格分开。谢谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-01-07 03:24:59

这只是你的一部分,但我不知道如何解析你的数据。例如,如果在Question 3中使用分号作为分隔符,则解析后的字符串将以['Home (dorm", " apartment)"]结尾。

代码语言:javascript
复制
>>> pd.Series([choice.strip() 
               for choice in df['Question 4'].str[1:-1].str.split(';').sum()]
    ).value_counts()
Family        3
alone         2
No one        2
Classmates    1
students      1
dtype: int64
票数 0
EN

Stack Overflow用户

发布于 2020-01-07 03:26:35

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59617712

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档