我有一个数据集有很大的数字。我想通过在除日期之外的所有列中使用humanize.intword函数来方便阅读。

当我只选择一个列时,它起作用:
pred_df["Predictions"].apply(lambda x: humanize.intword(x))当我试图选择其他数字列时,会得到一个错误:
pred_df.apply(lambda行:humanize.intword(行‘预测’,行‘下’,行‘上’),轴= 1) TypeError:序列项0:预期的str实例,浮起
我也尝试了清单理解,如这篇文章中的https://stackoverflow.com/questions/16476924/how-to-iterate-over-rows-in-a-dataframe-in-pandas,但我可能做错了什么。它适用于一列:
[humanize.intword(x) for x in pred_df["Predictions"]]当我尝试不同的列时,我会得到一个错误:
[humanize.intword(行1,row11)表示zip中的行(pred_df“预测”,pred_df“下端”)] IndexError:元组索引超出范围
我的dataframe包含12行4列。你能帮我理解一下是什么问题吗?
发布于 2021-05-31 06:08:21
问题是humanize.intword使用单个值并对其进行转换。但这里的目的是转换许多数字。一种方法是applymap
df.set_index("fiscal_date").applymap(humanize.intword)我们首先将日期设置为索引,以便在计算中不使用它。如果您愿意,可以将它放回带有reset_index()的列中。
至于你为什么会犯错误:
当我只选择一个列时,它起作用:
因为您选择了一个系列,传递给apply的是该列的单个条目,所以它可以工作。
当我试图选择其他数字列时,会得到一个错误:
因为您将向intword提供3个值,但它只能使用1+ 1,其中首先是要转换的值,另一个是可选格式。(错误消息应该是“此函数需要1到2个参数,但您提供了3",我相信。)
它适用于一列:
同样,这类似于一列上的第一个apply。
当我尝试不同的列时,我会得到一个错误:
同样,intword可以一次处理一个值。(但错误是因为您将11作为row的索引,其中只有来自这2列的条目的2个元素。)
https://stackoverflow.com/questions/67768547
复制相似问题