我在gitlab (大学自己的)上有一个存储库,由于没有数据限制,我们上传了几个重文件(jupyter笔记本)。这项工作是为一篇科学论文而做的,杂志要求我们提供代码。这是我们想要的。但他们要求我们把代码放在github上。
最后的工作没有太重的文件,但当将所有内容都推送到github时,系统会因为历史上的一些大文件而拒绝。
那么,我的问题是:在如何管理不同网站上的存储库方面,有没有一个好的做法?我对他们的第一个回答是“但是gitlab已经足够好了”。但后来我意识到没有自动的Zenodo更新,这就是为什么他们要求github (或至少推动不同于gitlab的东西)。
删除历史记录并将代码直接放到github上可以吗?有些工作是由学生完成的,我们更希望他们保留更改的所有权。
发布于 2020-12-15 04:01:36
对于大文件,应该使用Git Large File Storage来管理大文件。Migrate to using Git Large File Storage。然后迁移到Github。这也将使克隆存储库的速度更快,并使用更少的磁盘空间。
发布于 2020-12-16 17:58:53
所以,我找到了一个解决问题的方法:
我使用filter-branch从历史中删除了所有大文件(因为它们在项目结束时并不感兴趣),并且我能够将项目上传到github上。
我看过Git大型文件存储,但我不能理解其中的所有内容。因此,删除历史记录(仅基于文件大小,因此不是所有的历史记录都被删除)在我的情况下似乎是最好的。
https://stackoverflow.com/questions/65295380
复制相似问题