我正在使用深度学习在一个包含100个分类的大型数据集上进行图像识别。(与cifar-100的大小相比)我现在正在没有GPU的单个机器上调优超参数。训练速度非常慢。我想知道是否有任何现有的方法来在EC2星火集群上进行训练?我知道有SparkNet,但它似乎只支持Caffe。
发布于 2016-06-30 04:13:37
正如@Ramon评论的那样,spark with tensorflow可以通过广播参数来进行超参数调整。See this example from databricks
def map_fun(i):
import tensorflow as tf
with tf.Graph().as_default() as g:
hello = tf.constant('Hello, TensorFlow!', name="hello_constant")
with tf.Session() as sess:
return sess.run(hello)
rdd = sc.parallelize(range(10))
rdd.map(map_fun).collect()输出:
['Hello, TensorFlow!',
'Hello, TensorFlow!',
'Hello, TensorFlow!',
'Hello, TensorFlow!',
'Hello, TensorFlow!',
'Hello, TensorFlow!',
'Hello, TensorFlow!',
'Hello, TensorFlow!',
'Hello, TensorFlow!',
'Hello, TensorFlow!']发布于 2017-03-16 06:34:45
有一些最新的开发使得重用你的Spark集群来训练TensorFlow成为可能:
雅虎
https://stackoverflow.com/questions/37951731
复制相似问题