当将CSV文件读入pandas时,在设置数据类型时,下面的三个选项之间有区别吗?
选项1
df = pd.read_csv('file.csv', dtype='string')选项2
df = pd.read_csv('file.csv', dtype=str)选项3
df = pd.read_csv('file.csv', dtype='object')选项2和3似乎比选项1快得多(我读入的CSV有30,000行和500列),这表明这些选项的工作方式有所不同。然而,我找不到任何文档来说明为什么会出现这种情况--请谁解释一下?
发布于 2020-12-25 02:37:06
中的Parameters一节中的dtype事件清楚地说明了
“将字符串或object与适当na_values设置一起使用,以保留并不解释数据类型”。
这种解释产生了额外的负担,例如性能损失,特别是对于大尺寸的数据帧。
https://stackoverflow.com/questions/65441717
复制相似问题