首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Tensorflow和Hadoop部署

Tensorflow和Hadoop部署
EN

Stack Overflow用户
提问于 2017-04-06 17:18:10
回答 2查看 547关注 0票数 0

由于Hadoop Cloudera部署在基础架构节点和数据节点中工作,Tensorflow应该使用相同的硬件配置部署在哪里?在基础设施节点还是数据节点?

因为Tensorflow需要GPU,所以需要知道在哪里部署,这样我才能知道要添加GPU的节点。

EN

回答 2

Stack Overflow用户

发布于 2018-09-19 13:52:36

https://github.com/linkedin/TonY

使用TonY,您可以提交TensorFlow作业并指定工作进程的数量以及它们需要CPU还是GPU。

下面是如何在自述文件中使用它的示例:

tony目录中,还有一个包含所有TonY作业配置的tony.xml。例如:

代码语言:javascript
复制
$ cat tony/tony.xml
<configuration>
  <property>
    <name>tony.worker.instances</name>
    <value>4</value>
  </property>
  <property>
    <name>tony.worker.memory</name>
    <value>4g</value>
  </property>
  <property>
    <name>tony.worker.gpus</name>
    <value>1</value>
  </property>
  <property>
    <name>tony.ps.memory</name>
    <value>3g</value>
  </property>
</configuration>

有关配置的完整列表,请参阅维基。

模型代码

代码语言:javascript
复制
$ ls src/models/ | grep mnist_distributed
  mnist_distributed.py

然后,您可以启动您的作业:

代码语言:javascript
复制
$ java -cp "`hadoop classpath --glob`:tony/*:tony" \
            com.linkedin.tony.cli.ClusterSubmitter \
            -executes src/models/mnist_distributed.py \
            -task_params '--input_dir /path/to/hdfs/input --output_dir /path/to/hdfs/output --steps 2500 --batch_size 64' \
            -python_venv my-venv.zip \
            -python_binary_path Python/bin/python \
            -src_dir src \
            -shell_env LD_LIBRARY_PATH=/usr/java/latest/jre/lib/amd64/server

命令行参数如下:* executes描述训练代码入口点的位置。* task_params描述将被传递到入口点的命令行参数。* python_venv描述了将调用您的python脚本的本地压缩包的名称。* python_binary_path描述包含python二进制文件的python虚拟环境中的相对路径,或使用已安装在所有工作节点上的python二进制文件的绝对路径。* src_dir指定包含所有python模型源代码的本地根目录的名称。此目录将被复制到所有工作节点。* shell_env为将在python worker/ps进程中设置的环境变量指定键值对。

票数 2
EN

Stack Overflow用户

发布于 2018-01-26 23:55:56

Tensorflow可以使用CPU或GPU进行训练,但不需要GPU进行分类。下面是关于在Hadoop和YARN上运行Tensorflow的两个很好的指南:

https://www.tensorflow.org/deploy/hadoop

https://hortonworks.com/blog/distributed-tensorflow-assembly-hadoop-yarn/

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43250863

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档