我只是看看泰坦尼克号的Kaggle竞赛,发现.describe()函数中的这个参数很有趣。我拍了一个(用蓝色高亮显示)。这是笔记本的链接。

我一直想弄清楚它能做什么,但不能.排除什么数字?我去看了熊猫的文件,但发现没有用:
发布于 2020-08-31 11:02:12
当您将exclude="number"传递给df.describe时,熊猫排除了数据数据库中的所有列,这些列的数据类型是numpy.number的子类,它们是:
numpy.clongdouble,
numpy.complex128,
numpy.complex64,
numpy.complexfloating,
numpy.float16,
numpy.float32,
numpy.float64,
numpy.floating,
numpy.inexact,
numpy.int16,
numpy.int32,
numpy.int64,
numpy.int8,
numpy.intc,
numpy.integer,
numpy.longdouble,
numpy.signedinteger,
numpy.timedelta64,
numpy.uint16,
numpy.uint32,
numpy.uint64,
numpy.uint8,
numpy.uintc,
numpy.unsignedintegerIOW,只有非数字列保留在dataframe中。当您只想看到分类变量的摘要(如您共享的示例)时,这是有用的,因为默认情况下,非数字列的统计信息不会显示在.describe的输出中。
https://stackoverflow.com/questions/63668770
复制相似问题