首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在EC2星火集群上训练深度神经网络(tensorflow)?

如何在EC2星火集群上训练深度神经网络(tensorflow)?
EN

Stack Overflow用户
提问于 2016-06-22 02:16:11
回答 2查看 537关注 0票数 3

我正在使用深度学习在一个包含100个分类的大型数据集上进行图像识别。(与cifar-100的大小相比)我现在正在没有GPU的单个机器上调优超参数。训练速度非常慢。我想知道是否有任何现有的方法来在EC2星火集群上进行训练?我知道有SparkNet,但它似乎只支持Caffe。

EN

回答 2

Stack Overflow用户

发布于 2016-06-30 04:13:37

正如@Ramon评论的那样,spark with tensorflow可以通过广播参数来进行超参数调整。See this example from databricks

代码语言:javascript
复制
def map_fun(i):
  import tensorflow as tf
  with tf.Graph().as_default() as g:
    hello = tf.constant('Hello, TensorFlow!', name="hello_constant")
    with tf.Session() as sess:
      return sess.run(hello)

rdd = sc.parallelize(range(10))
rdd.map(map_fun).collect()

输出:

代码语言:javascript
复制
['Hello, TensorFlow!',
 'Hello, TensorFlow!',
 'Hello, TensorFlow!',
 'Hello, TensorFlow!',
 'Hello, TensorFlow!',
 'Hello, TensorFlow!',
 'Hello, TensorFlow!',
 'Hello, TensorFlow!',
 'Hello, TensorFlow!',
 'Hello, TensorFlow!']
票数 1
EN

Stack Overflow用户

发布于 2017-03-16 06:34:45

有一些最新的开发使得重用你的Spark集群来训练TensorFlow成为可能:

雅虎

  • !发布的TensorFlowOnSpark,它使用Spark为您管理分布式TensorFlow集群,并帮助处理数据摄取、启动和关闭等问题。
  • 如果您在Mesos群集上运行Spark,则可以按照here的说明在同一群集上运行TensorFlow。
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37951731

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档