首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >快速pytables数据切片

快速pytables数据切片
EN

Stack Overflow用户
提问于 2019-10-15 23:02:56
回答 1查看 38关注 0票数 0

我正遭受着跑步速度慢的痛苦。我的数据是

代码语言:javascript
复制
 <class 'pandas.io.pytables.HDFStore'>
 File path: c:/data/bed_1/acc_ohlc.hdf
 /000020            frame        (shape->[7721,5])
 /000030            frame        (shape->[1037,5])
 /000040            frame        (shape->[7723,5])
 /000050            frame        (shape->[7723,5])
 /000060            frame        (shape->[7723,5])
 /000070            frame        (shape->[7724,5])
 /000080            frame        (shape->[2426,5])

每一个都是pandas数据帧,每个数据长度都不同。索引是时间戳。用于制作具有所有相同周期数据的新数据集。

代码语言:javascript
复制
  begin = '20140117'
  end = '20150116'   
  p_data = {}
  for index, row in code_list.iterrows():
      code = row['Code'][:-3]
      p_data[code] = store[code].ix[begin:end].astype (float)
  new_data = pd.Panel(p_data)

new_data = pd.Panel (p_data)

总运行时间约为25秒。有没有什么好的代码可以缩短运行时间?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-15 23:40:37

像这样的事情可能会极大地加速这个过程。.iterrows可能不是最好的选择。

代码语言:javascript
复制
def fun(c):
   code = c[:-3]
   p_data[code] = store[code].ix[begin:end].astype (float)

code_list.Code.apply(fun)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58397678

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档