我在一个团队中使用dvc和git来控制版本控制数据文件。我们使用的是dvc 1.3.1,使用的是S3桶遥控器。在同事的分支上执行dvc fetch或dvc pull时,我会得到这个错误:
ERROR: failed to fetch data from the cloud - DVC-file 'C:\Users\blah\Documents\repo\data\processed_data.dvc' format error: extra keys not allowed @ data['outs'][0]['size']当我检查dvc文件中没有问题的缓存文件时,我会看到以下内容:
md5: ded591aacbe363f0518ceb9c3bc1836b
outs:
- md5: efdab20e8b59903b9523cc188ff727e5
path: completion_header.p
cache: true
metric: false
persist: false但是,有问题的文件只有以下几个:
outs:
- md5: f4e15187d9a0bbb328e629eabd8d1784.dir
size: 112007
nfiles: 3
path: processed_data在所有情况下,使用命令dvc add %dirname%将文件添加到dvc。这是我第二次在同事的部门(两个不同的人)上看到这种情况。
自从发帖以来,我就意识到我的同事dvc有一个目录。我尝试先创建目录,然后调用dvc fetch,但是得到了相同的错误。
发布于 2021-04-16 09:48:37
在所有情况下,
都会将文件添加到dvc中,命令dvc添加%文件名%。
似乎很有可能在较新版本的dvc中创建了一个dvc文件,并且您正在尝试使用旧版本。您的同事在添加新文件时是否都使用相同的dvc版本?
https://stackoverflow.com/questions/67122683
复制相似问题