首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何准备这个PyTorch官方ImageNet示例?

如何准备这个PyTorch官方ImageNet示例?
EN

Stack Overflow用户
提问于 2020-09-24 02:38:55
回答 1查看 1.9K关注 0票数 0

这是一个关于准备数据集的技术问题。

我试着遵循这个官方的例子

https://github.com/pytorch/examples/tree/master/imagenet

但我甚至不能从一开始,因为我不理解需求。上面写着

  1. 安装PyTorch (pytorch.org)
  2. pip install -r requirements.txt
  3. 然后从ImageNet下载http://www.image-net.org/数据集,并使用以下shell脚本将验证图像移动到标记的子文件夹

对于第一个需求,我正在研究Colab,所以我不认为我需要再次在我的本地pc上安装PyTorch。

第二个模块不起作用,因为显然没有名为"requirements.txt“的模块。这就是我开始意识到在这个git回购上我完全不知道如何使用的东西。无论如何,我可以直接从git打开文本文件,它只说使用torchtorchvision。好吧,我没问题进口它们。

第三项要求。因此,我去了ImageNet网站,并签署了研究使用协议。现在,需求告诉我要下载ImageNet数据,但是我看到了很多不同的选项(比如发布的年份、竞争的目的、决议等等)。哪一个是数据集?

我是PyTorch新手,我想我缺少一些关于PyTorch开发社区如何通过这种方式提供示例的协议.

任何帮助都将不胜感激。谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-09-25 08:05:44

显然没有一个叫做"requirements.txt“的模块

这是回购中的requirements.txt文件。您可以在这样的文件中添加包名,并使用pip一次安装所有软件包,这就是pip install -r requirements.txt的原因。当然,因为它只包含火炬和torvision,所以您不需要安装它,因为这些已经安装在google上。

哪一个是数据集?

我无法在没有注册的情况下访问这个页面,尽管您可以下载任何数据集(任何年份等),但重要的是,为了使用Imagefolder api (您提到的回购协议中使用的那个)来训练它,它的结构应该是这样的:

代码语言:javascript
复制
train/
    dog/
        xxx.png
        xxy.png
    cat/
        xxz.png
val/
    ...

您可以使用他们提到的用于Imagenet数据的脚本来这样做。

如果您刚刚开始使用pytorch,我建议您通过[医]火炬教程 (如这一个 )。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64038769

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档