这是一个关于准备数据集的技术问题。
我试着遵循这个官方的例子
https://github.com/pytorch/examples/tree/master/imagenet
但我甚至不能从一开始,因为我不理解需求。上面写着
pip install -r requirements.txt对于第一个需求,我正在研究Colab,所以我不认为我需要再次在我的本地pc上安装PyTorch。
第二个模块不起作用,因为显然没有名为"requirements.txt“的模块。这就是我开始意识到在这个git回购上我完全不知道如何使用的东西。无论如何,我可以直接从git打开文本文件,它只说使用torch和torchvision。好吧,我没问题进口它们。
第三项要求。因此,我去了ImageNet网站,并签署了研究使用协议。现在,需求告诉我要下载ImageNet数据,但是我看到了很多不同的选项(比如发布的年份、竞争的目的、决议等等)。哪一个是数据集?
我是PyTorch新手,我想我缺少一些关于PyTorch开发社区如何通过这种方式提供示例的协议.
任何帮助都将不胜感激。谢谢。
发布于 2020-09-25 08:05:44
显然没有一个叫做"requirements.txt“的模块
这是回购中的requirements.txt文件。您可以在这样的文件中添加包名,并使用pip一次安装所有软件包,这就是pip install -r requirements.txt的原因。当然,因为它只包含火炬和torvision,所以您不需要安装它,因为这些已经安装在google上。
哪一个是数据集?
我无法在没有注册的情况下访问这个页面,尽管您可以下载任何数据集(任何年份等),但重要的是,为了使用Imagefolder api (您提到的回购协议中使用的那个)来训练它,它的结构应该是这样的:
train/
dog/
xxx.png
xxy.png
cat/
xxz.png
val/
...您可以使用他们提到的用于Imagenet数据的脚本来这样做。
https://stackoverflow.com/questions/64038769
复制相似问题