文章/答案/技术大牛

发布

社区首页 >问答首页 >修改数据中每个单元格的有效方法

问修改数据中每个单元格的有效方法
EN

Stack Overflow用户

提问于 2022-06-02 12:34:07

回答 2查看 85关注 0票数 0

我正在处理python项目，并获得了一个包含多列和多行的数据格式。

我想摆脱所有的一切，除了在每个单元格的数字数据。不使用循环就能做到这一点吗？

以下是数据中的一个示例：

         a       b       c       d       e       f        g      h   
1    att-7   att-3  att-10  att-10   att-15  att-11    att-2  att-7  
2    att-9   att-7  att-12   att-4   att-10   att-4   att-13  att-4  
3   att-10   att-6   att-1   att-1   att-13  att-12    att-9  att-6

我想申请这样的东西：

def modify_string(cell):
    return cell.str.extract(r'(\d+)')

df_modified = df.apply(lambda x: modify_string(x))

这里有可能避免循环吗？什么是最有效的方式，因为数据相对较大？你将如何解决这个问题？

dataframe

python

pandas

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-06-02 13:07:57

使用applymap的第一种方法是按元素应用函数。它依赖于后面跟着“-”的数字。

df.applymap(lambda x: x.split('-')[-1])

如果情况并非总是如此，您还可以使用str.extract并提取数字。

df.stack().str.extract(r'(\d+)',expand=False).unstack()

输出：

    a  b   c   d   e   f   g  h
1   7  3  10  10  15  11   2  7
2   9  7  12   4  10   4  13  4
3  10  6   1   1  13  12   9  6

票数 1

Stack Overflow用户

发布于 2022-06-02 13:10:43

我将使用：https://pypi.org/project/pandarallel/和简单的应用函数。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72476355

复制

相似问题

问修改数据中每个单元格的有效方法
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问修改数据中每个单元格的有效方法EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问修改数据中每个单元格的有效方法
EN