拥有巨蟒-熊猫的知识和可伸缩的云,在云中实现并行计算的最佳方法是什么?(我只有一台cpu多的机器,没有多少台机器)
我目前拥有的云是Amazon,带有windows服务器(可扩展到40 cpu和160 OS内存),但我可以评估使用不同的云提供商和不同的操作系统。
我想到了两种可能性:
星星之火应该比python多处理更有效吗?还有其他方法我可以评估吗?
发布于 2016-11-20 14:44:53
要用启动脚本启动一个Spark独立集群,您应该在您的Spark目录中创建一个名为conf/ scripts的文件,该文件必须包含您打算启动火花工作者的所有机器的主机名,每行一个。
见此处:http://spark.apache.org/docs/latest/spark-standalone.html#cluster-launch-scripts
祝好运
https://stackoverflow.com/questions/40705110
复制相似问题