首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫0.14.1 StataReader -阅读.dta文件

熊猫0.14.1 StataReader -阅读.dta文件
EN

Stack Overflow用户
提问于 2014-08-14 22:14:17
回答 1查看 1.2K关注 0票数 3

我正在尝试使用StataReader从Stata 13导入一个大型数据集到熊猫中。这在熊猫0.13.1中运行得很好,但在我升级到0.14.1之后,读取.dta文件的能力似乎急剧恶化。有没有人知道发生了什么(我在熊猫网站的“什么是新的”一栏中找不到StataReader的任何变化),以及/或如何解决这个问题?

复制我的问题的步骤:

  1. 在Stata 13中创建大型数据集: 清除设置obs 11500值i= 1/8000{ gen var`i‘=1} saveold bigdataset,替换
  2. 试着用StataReader读给熊猫看: 从pandas.io.stata导入StataReader reader = StataReader('bigdataset.dta') data = reader.data()

使用熊猫0.13.1,这大约需要220秒,这是可以接受的,但使用熊猫0.14.1,即使在等待20分钟后也没有发生任何事情。

当我用更小的数据集测试此问题时:

  1. 在Stata 13中创建一个较小的数据集: 清除设置obs 11500值i= 1/1000{ gen var`i‘=1} saveold小数据集,替换
  2. 试着用StataReader读给熊猫看: 从pandas.io.stata导入StataReader reader = StataReader('smalldataset.dta') data = reader.data()

使用熊猫0.13.1,这大约需要20秒,而使用熊猫0.14.1,大约需要300秒。

我真的很想升级到新的熊猫版本,并使用我的数据,它大约是bigdataset.dta的大小。有谁知道我能有效导入数据的方法吗?

EN

回答 1

Stack Overflow用户

发布于 2014-08-19 20:55:25

对于那些无意中发现这个问题并对答案感兴趣的人--我按照罗伯托的建议把这个问题贴在了“熊猫吉蒂布”页面上,他们发现并解决了表演问题。现在就用他们的主干道吧!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25318397

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档