文章/答案/技术大牛

发布

社区首页 >问答首页 >熊猫0.14.1 StataReader -阅读.dta文件

问熊猫0.14.1 StataReader -阅读.dta文件
EN

Stack Overflow用户

提问于 2014-08-14 22:14:17

回答 1查看 1.2K关注 0票数 3

我正在尝试使用StataReader从Stata 13导入一个大型数据集到熊猫中。这在熊猫0.13.1中运行得很好，但在我升级到0.14.1之后，读取.dta文件的能力似乎急剧恶化。有没有人知道发生了什么(我在熊猫网站的“什么是新的”一栏中找不到StataReader的任何变化)，以及/或如何解决这个问题？

复制我的问题的步骤：

在Stata 13中创建大型数据集：清除设置obs 11500值i= 1/8000{ gen var`i‘=1} saveold bigdataset，替换
试着用StataReader读给熊猫看：从pandas.io.stata导入StataReader reader = StataReader('bigdataset.dta') data = reader.data()

使用熊猫0.13.1，这大约需要220秒，这是可以接受的，但使用熊猫0.14.1，即使在等待20分钟后也没有发生任何事情。

当我用更小的数据集测试此问题时：：

在Stata 13中创建一个较小的数据集：清除设置obs 11500值i= 1/1000{ gen var`i‘=1} saveold小数据集，替换
试着用StataReader读给熊猫看：从pandas.io.stata导入StataReader reader = StataReader('smalldataset.dta') data = reader.data()

使用熊猫0.13.1，这大约需要20秒，而使用熊猫0.14.1，大约需要300秒。

我真的很想升级到新的熊猫版本，并使用我的数据，它大约是bigdataset.dta的大小。有谁知道我能有效导入数据的方法吗？

python

python-2.7

pandas

stata

回答 1

Stack Overflow用户

发布于 2014-08-19 20:55:25

对于那些无意中发现这个问题并对答案感兴趣的人--我按照罗伯托的建议把这个问题贴在了“熊猫吉蒂布”页面上，他们发现并解决了表演问题。现在就用他们的主干道吧！

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/25318397

复制

相似问题

问熊猫0.14.1 StataReader -阅读.dta文件
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问熊猫0.14.1 StataReader -阅读.dta文件EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问熊猫0.14.1 StataReader -阅读.dta文件
EN