我正在从事一个机器人研究项目,并想知道:在组织科学数据和代码时,是否有人对最佳实践提出了建议?有没有人知道现有的科学图书馆有我能查到的资料?
以下是我们的“套房”的要素:
我们的“套房”的一些设计方面:
我看到了this的帖子,这些书看起来很有趣,我已经订购了“编写科学软件”,但我觉得它将主要关注模拟代码的实现,而不是整个组织。
发布于 2012-10-06 10:17:52
你所描述的情况与我们在表面动力学实验室中的情况非常相似。有些工作涉及保存实时分析的测量数据,或者为后期的analysis.Some保存其他工作,另一方面,包括运行模拟和分析其结果。
这一数据管理方案是实验室负责人在剑桥学习期间学习的,它围绕着一台主服务器,该服务器保存着所有实验室成员的个人档案。每个成员通过使用NFS挂载适当的服务器文件夹从他的工作站访问文件。这有其优点和缺点。备份所有内容都比较容易,但在通过网络处理大量数据时会出现问题。因此,我是实验室中的一个例外,因为我使用的模拟生成了大量的数据。这些数据保存在我的工作站上,只有生成它的代码(模拟和配置文件的源代码)保存在服务器上。
我还将我的代码保存在一个在线SVN服务中,因为我不能从家里登录到实验室服务器。这是一种强制性的做法,因为如果出现了一些模糊的bug,则需要能够根据需求复制旧的结果,并跟踪代码的更改。因此,需要维护旧版本和配置文件。
我们还使用低技术方法,例如实验室笔记本来记录结果、修改等。这些内容有时会更抽象(没有必要描述代码中每一行更改的内容-对此您有差异)。只是更改的目的,也许是关于实现及其日期的一些注释)。
工作主要是用Matlab完成的。同样,我是一个例外,因为我更喜欢Python。我还使用C语言进行数据生成仿真。测试大多是收敛性的,因为我的项目现在关注的是与计算模型的比较。我只生成不同配置的结果,保存在它们自己的受人尊敬的文件夹中(我在实验室日志中跟踪了这个文件夹)。这样做的好处是能够按照我想要的方式来控制和接口数据,而不是遵从其他人的想法和格式。
https://stackoverflow.com/questions/12030732
复制相似问题