我正在尝试使用StataReader从Stata 13导入一个大型数据集到熊猫中。这在熊猫0.13.1中运行得很好,但在我升级到0.14.1之后,读取.dta文件的能力似乎急剧恶化。有没有人知道发生了什么(我在熊猫网站的“什么是新的”一栏中找不到StataReader的任何变化),以及/或如何解决这个问题?
复制我的问题的步骤:
使用熊猫0.13.1,这大约需要220秒,这是可以接受的,但使用熊猫0.14.1,即使在等待20分钟后也没有发生任何事情。
当我用更小的数据集测试此问题时::
使用熊猫0.13.1,这大约需要20秒,而使用熊猫0.14.1,大约需要300秒。
我真的很想升级到新的熊猫版本,并使用我的数据,它大约是bigdataset.dta的大小。有谁知道我能有效导入数据的方法吗?
发布于 2014-08-19 20:55:25
对于那些无意中发现这个问题并对答案感兴趣的人--我按照罗伯托的建议把这个问题贴在了“熊猫吉蒂布”页面上,他们发现并解决了表演问题。现在就用他们的主干道吧!
https://stackoverflow.com/questions/25318397
复制相似问题