我是一名商业情报分析员,从使用python进行数据分析开始。
我正处于为内部使用(营销分析师)编写营销分析应用程序的早期阶段,不需要使用MS进行计算。
主要目标是:
目前,我已经将项目分解为两个文件:main.py (主函数和打印)和(与数据清除和转换相关的函数)。
我认为必须有一个框架或某种模式来以逻辑和有组织的方式破坏文件,我希望在早期阶段应用这个框架或模型,以避免返工,并构建一个更可靠和更易于维护的应用程序。
PS:在这个线程中,我关注的是文件/目录结构,而不是我需要使用的.库。
发布于 2017-08-08 18:56:40
只要文件位置是一致的(共享文件夹、集群文件夹、web服务API派生的位置),我认为没有最佳的方法来组织您的文件或目录。在你的标签清楚,你应该能够把你的所有数据集中在一个地方。文件结构,如:
/Marketing/Analysis/dev/
./source <- for csv files to be kept
./prog <- for your .py files (actual code)
./result <- output from your process
./notes <- for anything non-functional (ie, release notes or project requests)你的代码有藏物或比特桶回购吗?如果是这样,请将其用于抓取工作,并仅将当前代码保存在./prog中。
如果您正在使用GoogleAnalytics,您可能希望直接从Python调用,而不是将csv文件下载到./source。它只会将变量的数量减少一个。
https://stackoverflow.com/questions/45573558
复制相似问题