首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否有用于注册/识别Pandas数据分析工作流模式的包?

是否有用于注册/识别Pandas数据分析工作流模式的包?
EN

Stack Overflow用户
提问于 2017-04-03 22:07:33
回答 1查看 31关注 0票数 0

我正在使用Pandas自动分析各种不同的第三方报告。大多数是csv格式的。

假设程序中只加载了正确的文件,我需要:

  • 基于确定报告的来源(第三方)
    • 模式
    • 可预测列值

  • 存储同样来源的历史报告,
  • 回到原点,也许还有别的事-是的

一开始我只需要管理10份报告。我想它可能会发展到几百个以上--注意到一个普通的文件和一些字典无法处理。但为什么要重新发明轮子..。

是否有用于注册/识别Pandas数据分析工作流模式的包?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-22 18:08:29

我采取了第一次通过的解决方案,我将提供的答案。我用defaultdict实现了一个基于类的解决方案。以下是基本大纲:

  • 寄存器类oop结构,用于处理和访问脚本中的模式
    • Report(object)
    • ChildReport(Report)

  • “生动”或多维字典结构,用于使用Python的defaultdict:处理报表集合
    • client_reports['date']['type'] = ChildReport(self)

  • ReportsManager(object)类。初始化vividict,并收集用于访问和管理集合的多个方法--每个客户端一个。
  • Pickle模块用于存储ReportManager对象--每个客户端一个。

对于如何使用defaultdict类构造ReportsManager,我有一些疑问。这是个开始。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43195133

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档