我使用Pandas已经快6个月了,在我看来,最大的争论之一是关于迭代数据帧,通过.iterrows() .apply()或list-comprehension来计算新数据。
我曾多次尝试使用.loc或类似的访问器来写入数据。问题是,当我有许多条件时,我过去在一行代码中解决的问题,我将需要创建许多行的.iloc来实现数据。
简而言之:即使数据帧不是很大,总是避免迭代并拥有更长的代码行是否有回报?
有没有人推荐一些文章来解释这种效率权衡?
发布于 2021-03-25 02:45:53
有一篇很棒的文章,介绍了迭代数据帧的不同方法,以及每种方法所需的时间。我个人觉得它很有帮助。看一下:https://towardsdatascience.com/apply-function-to-pandas-dataframe-rows-76df74165ee4
https://stackoverflow.com/questions/66785734
复制相似问题